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(57) Abstract: The invention concerns polypeptides derived from vitamin D nuclear receptor, said nuclear receptor comprising a 
iigand-binding domain, or LBD, said LBD containing a flexible insertion domain. Said polypeptides are characterised in that the 
LBD flexible insertion domain is modified by substituting or suppressing at least 30 acids. The invention also concerns die use of said 
polvpeptides in particular for screening synthetic vitamin D analogues or for producing tests ^double or triple hybrid) for identifying 
other proteins (activator, repressor....) interacting with the vitamin D receptor using constructs containing the polypeptide fused with 
Gal 4 for example, or for analysing three-dimensjonal structures of complexes formed between said polypeptides and a particular 
molecule by crystallography or NMR. 

(57) Abrege: L* invention a pour objet des polypeptides derives du recepteur nucleaire de la vitamine D. ledit recepteur nucleaire 
comprenant un domaine de liaison au ligand. ou LBD, ce LBD nontenant undomaine d' insertion flexible, lesdits polypeptides derives 
etant caractenses en ce que le domaine d" insertion flexible du LBD est modifie par substitution ou suppression dau moins environ 
30 acides, ainsi que V utilisation de ces polypeptides notamment dans le cadre du cnblage d analogues synlhetiques de la vitamine 
D. ou dans la mise au point dc tests (double ou triple hybnde) pour 1* identification d'aulres proteines (activateur. represseur....) 
interagtssant avec le recepteur de la vitamine D par Iuiilisation de constructions contenant le polypeptide en fusion avec GaJ4 par 
exemple. ou dans le cadre de I' analyse de la structure tridimensionnelle des complexes formes en ire ces polypeptides et une molecule 
pamcubere par cn stall ographie ou RMN. 
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POLYPEPTIDES DERIVES DU RECEPTEUR NUCLEAJRE DE LA 
VITAMINE D, ET LEURS UTILISATIONS NOTAMMENT DANS LE CADRE 
DU CRIBLAGE D'ANALOGUES DE LA VITAMINE D 



L'invention a pour objct des polypeptides derives du recepteur nucleaire de la 
vitamine D, les sequences nucleotidiques codant pour ces polypeptides, ainsi que 
l'utilisation de ces polypeptides notamment dans le cadre du cnblage d'analogues 
synthetiques de la vitamine D, ou dans la mise au point de tests (par exemple double ou 

10 triple hybride,...) pour Identification d'autrcs proteines (activateur, represseur, ...) 

interagissant avec le recepteur de la vitamine D par l'utilisation de constructions 
contenant le polypeptide en fusion avec Gal4 par exemple, ou dans le cadre de l'analyse 
de la structure tndimensionnelle des complexes formes entre ces polypeptides et une 
molecule particuliere par des techniques de cnstallographie ou RMN. 

15 Le recepteur de la vitamine D (VDR) est un regulateur transcriptionnel dependant 

du ligand, appartenant a la superfamille des recepteurs nucleaires (NRs) (Mangelsdorf 
et al., 1995 ). 

Les membres de cette famille possedent la meme structure modulaire avec un 
domame de liaison a TADN (DBD) hautemcnt conserve et un domaine de liaison au 
20 ligand (LBD) davantage variable (Mangelsdorf et al., 1995 ; Wurtz et al., 1996). 

Le VDR se lie a l'element de reponse correspondant, de type DR3, dans la region 
promotnce des genes cibles, sous forme d'heterodimere avec le recepteur X de l'acide 
retinoique (RXR), ce qui conduit a 1'activation ou a la repression de la transcription par 
rintermediaire d'une interaction avec les cofactcurs transcriptionnels et la machinerie 
25 transcriptionnelle basale (Deluca & Zierold, 1998). 

Les metabolites de la vitamine D sont utilises, ou sont susceptibles d'etre utilises, 
dans des traitements varies dans le cadre de I'osteodystrophie, l'osteoporose, le psoriasis, 
le cancer et les maladies auto-immunes (Bouillon et aL 1995). 

L'hypercalcemie induite par la vitamine D (ou la, 25 - dihydroxyvitamine D?, ou 
30 l,25(OH) 2 D 3 ) limite l'utilisation du ligand naturel dans ces applications cliniques, ce 

qui a conduit au developpement d'analogues susceptibles de posseder des effets 
secondaires reduits. 

La sequence du LBD de hVDR est faiblement consen'ee en comparaison avec les 
sequences du recepteur de l'acide retinoique y humain (hRAR y) et du recepteur X de 



5 



WO 0 1 /38393 2 PCT/FROO/03248 

Tacide retino'ique a humain fhRXRa) (respectivement 25 % et 17 % d'identite avec le 
hVDR). 

La presence d'un domame d'insertion dans le LBD des VDR connectant les 
helices Hi et H3, represente une caracteristique typique des VDR. La taille de cette 
5 region de connexion varie entre 72 a 81 residus dans la famille des VDR, tandis qu'elle 

vane entre 1 5 a 25 residus chez les autres recepteurs nucleaires. 

II convient de souligner que dans ce qui suit la numerotation des acides amines 
utilisee pour les sequences peptidiques des differents VDR, correspond a la 
numerotation des acides amines du VDR humain. L'extension de cette numerotation aux 
10 autres sequences que celle du VDR humain peut se faire sans ambiguite a partir de 

ralignement donne sur la figure la ci-apres. 

Le taux de conservation de sequence de ce domaine d'insertion est tres faible (9 % 
d'identite entre les acides amines 157-215 du hVDR). Cette region est accessible aux 
proteases, et contient un site de phosphorylation au niveau de la serine en position 208, 
15 pour lequel aucun role fonctionnel n'a pu etre defini. 

La presence de ce domaine pourrait expliquer les difficultes rencontrees jusqu'a 
present pour cnstalliser les LBD des VDR. En effet, ce domaine est faiblement structure 
comrae le montre les analyses de structure secondaire qui ne predisent que quelques 
brins courts avec des statistiques assez faibles, et contient un pourcentage tres eleve de 
20 residus charges negativement. Ces deux facteurs pourraient augmenter le nombre de 

conformeres de cette boucle, affectant ainsi la stabilite de la proteine, et favonsant les 
contacts non specifiques qui interferent avec les processus de cristallisation. 

La presente invention a pour but de foumir des polypeptides derives des 
recepteurs nucleaires de la vitamine D sous une forme soluble et pouvant etre 
25 cristallises. 

L'invention a egalement pour but de foumir des sequences nucleotidiques codant 
pour ces polypeptides derives, ainsi que des procedes de preparation desdits 
polypeptides derives par transformation de cellules appropriees avec lesdites sequences 
nucleotidiques. 

30 L'invention a egalement pour but de fournir de nouvelles methodes de cnblage de 

composes analogues de la vitamine D et/ou d'analyse de la structure tridimensionnelle 
des complexes formes entre ces polypeptides et une molecule particuliere, lesdites 
methodes etant effectuecs a l'aide des polypeptides derives susmentionnes. 
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L'invention a egalement pour but de foumir des kits pour la rnise en oeuvre des 
methodes susmentionnees. 

L'invention sera illustree a l'aide des figures suivantes : 

- Figure 1 : a) alignement des sequences peptidiques des VDR de differentes 
5 especes (hVDR : VDR d'homo sapiens [humain]; bVDR : VDR de bos taurus [bovin]; 

gVDR : VDR de gallus gallus [poulet]; rVDR : VDR de ratus norvegicus [rat]; 
mVDR : VDR de mus mus cuius [souris]; cVDR : VDR de cotumic japomca [caille 
japonaise]; xVDR : VDR de xenopus laevi [grenouille africaine]) avec les sequences 
du RXRot humain (hRXRot) et du RARy humain (hRARy). Les domaines d'insertion 
10 des VDR qui ont ete supprimes sont ceux encadres. 

b) conformation generale du domaine de liaison au ligand de 
hVDR; les helices sont representees par des cylindres et les feuillets p par des fleches. 

- Figure 2 : a) analyse de Scatchard de la liaison de l,25(OH)2 D3 au LBD 
du hVDR sauvage (118-427; courbe en pointille indiquee par des triangles) et au LBD 

15 du mutant derive du hVDR (118-427 A 165-215; courbe pleine indiquee par des 

losanges) ; la quantite de l,25(OH)2 D3 marquee lice est indiquee en abscisse en nM, 
et le rapport B/U entre les LBD sauvage ou mutant lies (B) et non lies (U) est indique 
en ordonnee. 

b) activites CAT du hVDR sauvage et du hVDR mutant; ces 
20 activites sont indiquees en ordonnee en pourcentage; la colonne 1 correspond a 1'activite 

CAT mesuree en absence de vitamine D (VD), de hVDR sauvage (sauvage) et de hVDR 
mutant (tronque); la colonne 2 correspond a 1'activite CAT mesuree en presence de VD, 
et en 1'absence de hVDR sauvage et de hVDR mutant; la colonne 3 correspond a 
1'activite CAT mesuree en presence de hVDR sauvage, et en 1'absence de VD et de 
25 hVDR mutant; la colonne 4 correspond a 1'activite CAT mesuree en presence de VD et 

de hVDR sauvage, et en 1'absence de hVDR mutant; la colonne 5 correspond a 1'activite 
CAT mesuree en presence de hVDR mutant, et en 1'absence de VD et de hVDR 
sauvage; la colonne 6 correspond a 1'activite CAT mesuree en presence de hVDR 
mutant et de VD, et en 1'absence de hVDR sauvage. 
30 - Figure 3 : a) representation de la region du feuillet P de RARy, 

b) representation de la region du feuillet p du VDR dans la 
memo orientation que cclle de RARy ci-dessus, 
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c) representation des interactions intramoleculaires de I'helice 

H12dans le VDR, 

d) interface entre le LBD du VDR et I'helice H3n d'une molecule 

symetriquement reliee. 

- Figure 4 : a) schema de 1 ,25(OH) 2 D 3l 

b) representation schcmatique de la poche de liaison au ligand 

du hVDR, 

c) vitamine D dans sa densite electronique contouree a la, 

d) cavite du ligand. 

- Figure 5 : sequence nucleotidique codant pour le hVDR sauvage (SEQ ID 
NO : 1), et sequence peptidique du hVDR sauvage (SEQ ID NO : 2), 

- Figure 6 : sequence nucleotidique (SEQ ID NO : 3) codant pour le polypeptide 
mutant derive du hVDR (1-427 A 165-215), et sequence peptidique dudit polypeptide 
(SEQ ID NO : 4), 

- Figure 7 : sequence nucleotidique (SEQ ID NO : 5) codant pour le polypeptide 
mutant derive du hVDR (118-427 A 165-215), et sequence peptidique dudit 
polypeptide (SEQ ID NO : 6), 

- Figure 8 : sequence nucleotidique (SEQ ID NO : 7) codant pour le polypeptide 
mutant derive du hVDR (124-427 A 165-215), et sequence peptidique dudit 
polypeptide (SEQ ID NO : 8) 

La presente invention a pour objet les polypeptides derives du recepteur 
nucleaire de la vitamine D chez Fhomme ou les differentes especes du regne animal 
possedant un tel recepteur, ledit recepteur nucleaire comprenant un domaine de liaison 
au ligand, ou LBD, ce LBD contenant un domaine d insertion flexible, lesdits 
polypeptides derives etant caracterisds en ce qu'ils comprennent : 

- les sequences peptidiques desdits recepteurs nucleaires dans lesquelles : 

* le domaine d' insertion flexible du LBD est modifie par substitution ou 
suppression d'au moins environ 30 acides amines, et de preference d'au moins environ 
40 acides amines, ou de la totalite des acides amines composant ce domaine 
d' insertion (a savoir environ 50 +_ 10 acides amines), 
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* et. le cas echeant, un ou plusieurs ou la totalite des acides amines situes aux 
positions 1 a environ 125, notamment aux positions 1 a 117 ou 123, des sequences 
peptidiques desdits VDR, sont modifies par substitution ou suppression, 

lesdits polypeptides deriv6s possedant les caracteristiques suivantes : 
5 * les proprietes de liaison au ligand et de transactivation du LBD du recepteur 

de la vitamine D sont conservees, 

* ils sont stables, a savoir qu'ils peuvent etre conserves, notamment dans 
NaCl 100 mM a pH 7 pendant au moins environ une semaine, sans que soit pour 
autant affectees les proprietes susmentionnees du LBD, par opposition au LBD non 

10 modifie qui est instable dans les conditions susmentionnees, 

* ils sont cristallisables dans des solvants aqueux, notamment a 4°C par la 
rnethode de diffusion de vapeur a goutte suspendue, 

* et, ils sont solubles dans des solvants aqueux, 

- ou les sequences peptidiques derivees des sequences peptidiques definies ci- 
15 dessus, notamment par suppression, addition ou substitution d'un ou plusieurs acides 

amines, lesdites sequences derivees possedant les caracteristiques mentionnees ci- 
dessus desdits polypeptides derives. 

L' invention a plus particulierement pour objet les polypeptides derives des VDR 
d'origine humaine ou animale tels que definis ci-dessus, lesdits polypeptides derives 
20 etant caracterises en ce qu'ils comprennent les sequences peptidiques desdits 

recepteurs nucleaires dans lesquelles est supprime le fragment peptidique delimite : 

- d'une part, par un acide amine situe approximativement a Tune des positions 
155 a 175 des sequences peptidiques des recepteurs nucleaires de la vitamine D 
d'origine humaine ou animale, notamment des sequences peptidiques des VDR 

25 representees sur la figure la, et plus particulierement par 1' acide amine situe a Tune 

des positions 159 a 168 de ces sequences, 

- et, d'autre part, par un acide amine situe approximativement a Tune des 
positions 204 a 225 des sequences peptidiques des recepteurs nucleaires de la vitamine 
D d'origine humaine ou animale, notamment des sequences peptidiques des VDR 

30 representees sur la figure la. 

L' invention concerne plus particulierement les polypeptides ddrives tels que 
definis ci-dessus, lesdits polypeptides derives etant choisis parmi ceux comprenant : 



WO 01/38393 6 PCT/FR00/03248 

- la sequence en acides amines delimitee par les acides amines situes aux 
positions 118 et 427, ou aux positions 124 et 427 des sequences peptidiques des VDR 
d'origine humaine ou animate, notamment des sequences peptidiques des VDR 
representees sur la figure la, et dans laquelle les residus situes aux positions 165 a 

5 215 desdites sequences peptidiques des VDR sont supprimes, 

- ou une sequence peptidique derivee de la sequence en acides amines 
susmentionnce, notamment par suppression, addition ou substitution d'un ou plusieurs 
acides amines, ladite sequence derivee possedant les caracteristiques mentionnees ci- 
dessus dudit polypeptide derive. 

10 V invention concerne plus particulierement les polypeptides derives tels que 

definis ci-dessus choisis parmi les suivants : 

- le polypeptide SEQ ID NO : 4 derive du VDR d'origine humaine dans lequel 
le fragment peptidique delimite par les acides amines situes aux positions 165 et 215 
est supprime, 

15 - le polypeptide SEQ ID NO : 6 [encore designe hVDR (118-427 A 165-215)] 

derive du VDR d'origine humaine dans lequel le fragment peptidique delimite par les 
acides amines situes aux positions 1 et 117, et le fragment peptidique delimite par les 
acides amines situes aux positions 165 et 215 sont supprimes, 

- le polypeptide SEQ ID NO : 8 [encore designe hVDR (124-427 A 165-215)] 
20 derive du VDR d'origine humaine dans lequel le fragment peptidique delimite par les 

acides amines situes aux positions 1 et 123, et le fragment peptidique delimite par les 
acides amines situes aux positions 165 et 215 sont supprimes. 

L' invention concerne egalement les sequences nucleotidiques codant pour un 
polypeptide derive tel que defini ci-dessus. 
25 A ce titre, 1" invention a plus particulierement pour objet les sequences 

nucleotidiques choisies parmi : 

- les sequences SEQ ID NO : 3, SEQ ID NO : 5 et SEQ ID NO : 7, 
representees respectivement sur les figures 6, 7, et 8, 

- ou une sequence nucleotidique derivee par degenerescence du code genctique 
30 des sequences nucleotidiques susrnentionnees, et codant pour un polypeptide derive du 

hVDR tcl que defini ci-dessus, 
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- ou une sequence nucleotidique derivee des sequences nucleotidiques 
susmentionnees, notamment par substitution, suppression ou addition d'un ou plusieurs 
nucleotides, et codant pour une sequence peptidique derivee des polypeptides derives 
du hVDR definis ci-dessus, et possedant les caracteristiques mentionnees ci-dessus 

5 desdits polypeptides derives. 

L' invention a egalement pour objet les sequences nucleotidiques recombinantes 
comprenant une sequence nucleotidique telle que definie ci-dessus en association avec 
les elements n£cessaires a la transcription de cette derniere sequence, notamment avec 
un promoteur et un terminateur de transcription. 
10 L'invention concerne egalement les vecteurs, notamment plasmides ou virus tels 

que les baculovirus, contenant une sequence nucleotidique telle que definie ci-dessus. 

L'invention a egalement pour objet les cellules hotes transformees par un 
vecteur susmentionne, lesdites cellules etant choisies notamment parmi les bacteries 
telles que E. coli y ou les cellules d'insectes susceptibles d'etre infectees par un 
15 baculovirus. 

L'invention concerne egalement un procede de preparation d'un polypeptide 
derive tel que defini ci-dessus, ledit procede comprenant les etapes suivantes : 

- transformation de cellules a l'aide d'un vecteur recombinant tel que defini ci- 
dessus, 

20 - mise en culture des cellules ainsi transformees, et recuperation dudit 

polypeptide produit par lesdites cellules, le cas echeant apres purification. 

L'invention concerne egalement les polypeptides derives du recepteur nucleaire 
de la vitamine D tels que ddfinis ci-dessus, lies a la vitamine D ou a un analogue de la 
vitamine D, notamment a tout ligand capable de se lier auxdits polypeptides avec une 

25 haute affinity k savoir une affinite superieure a environ 10" 6 M. 

L'invention concerne egalement les polypeptides derives du recepteur nucleaire 
de la vitamine D tels que definis ci-dessus, le cas echeant lies a la vitamine D ou a un 
analogue de la vitamine D, et se presentant sous forme de cristaux. 

Avantageusement, les cristaux susmentionnes de la preseme invention sont 
30 obtenus par diffusion de vapeur en presence notamment de sulfate d'ammonium en 

tant que precipitant, ou d'un autre agent precipitant. 
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Avantageusernent encore, les cristaux de 1* invention sont utilisables dans le 
cadre de techniques de cristallographie aux rayons X. 

Les cristaux susmentionnes peuvent atteindre une resolution determinee par 
cristallographie aux rayons X inferieure a 25 A, qui foumit une information au niveau 
5 atomique de Interaction entre une molecule cible et le recepteur. 

L' invention a plus particulierement pour objet les cristaux de hVDR (1 18-427 A 
165-215) complexe a 1,25 (OH) 2 D 3 ), caracterises en ce qu'ils appartiennent au groupe 
d'espace orthorhombique (P2, 2 ] 2,) avec a = 45.193 A, b = 52.443 A , c = 133.286 A, 
& = P-Y = 90°. 

10 L' invention a egalement pour objet 1'utilisation d'un polypeptide tel que defini 

ci-dessus, le cas echeant sous forme de cristaux susmentionnes, pour la mise en ceuvre 
d'une methode de criblage d' analogues synthetiques de la vitamine D. 

L'invention a plus particulierement pour objet 1'utilisation susmentionnee d'un 
polypeptide tel que defini ci-dessus, le cas echeant sous forme de cristaux 

15 susmentionnes, pour la mise en ceuvre d'une methode de criblage d'analogues 

agonistes ou antagonistes de la vitamine D susceptibles d'etre utilises dans des 
compositions pharmaceutiques, notamment dans le cadre du traitement de pathologies 
cancereuses, de l'osteodystrophie, de l'osteoporose, du psoriasis, des maladies auto- 
immunes. 

20 L' invention concerne egalement des procedes de criblage d'analogues de la 

vitamine D, ou de cofacteurs, comprenant les etapes suivantes : 

- mise en presence d'un polypeptide derive tel que defini ci-dessus, le cas 
echeant sous forme de cristaux susmentionnes, avantageusernent lie a un support 
solide, avec l'analogue ou cofacteur teste, fun dudit polypeptide derive ou de 

25 T analogue de la vitamine D etant avantageusernent marque, notamment a l'aide d'un 

marqueur fluorescent, radioactif ou enzymatique, 

- detection de l'eventuelle liaison entre ledit polypeptide derive et l'analogue 
teste par mesure du marqueur utilise, notamment apres rin^age du support utilise lors 
de l'etape precedente. 

30 L' invention a egalement pour objet 1'utilisation d'un polypeptide derive tel que 

defini ci-dessus, le cas echeant sous forme de cristaux susmentionnes, pour la mise en 
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ceuvre d'une methode d' analyse de la structure tridimensionnelle des complexes 
formes entre ledit polypeptide et une molecule determinee. 

A ce titre l'invention concerne plus particulierement une methode d'analyse de 
la structure tridimensionnelle des complexes formes entre un polypeptide derive tel 
5 que defini ci-dessus, le cas echeant sous forme de cristaux susmentionnes, et une 

molecule determinee, ledit procede comprenant les 6tapes suivantes : 

- mise en presence d'un polypeptide derive tel que defini ci-dessus, le cas 
echeant sous forme de cristaux susmentionnes, avec la molecule determinee, 

- cristallisation du complexe forme entre ledit polypeptide derive et la molecule 
10 determinee, notamment par diffusion de vapeur, et analyse tridimensionnelle dudit 

complexe notamment par remplacement moleculaire, 

- ou analyse tridimensionnelle dudit complexe en solution, notamment par 
RMN. 

L' invention concerne egalement l'application de la methode d'analyse 
15 susmentionnee a la conception de composes susceptibles d'etre des agonistes ou des 

antagonistes de la vitamine D tels que definis ci-dessus. 

L' invention a plus particulierement pour objet les analogues agonistes ou 
antagonistes de la vitamine D tels qu'obtenus par mise en ceuvre d'un procede de 
criblage susmentionne, ainsi que les compositions pharmaceutiques comprenant ces 
20 analogues en association avec un vehicule pharmaceutiquement acceptable. 

L' invention a egalement pour objet les kits (ou trousses) pour la mise en oeuvre 
d'un procede de criblage ou d'une methode d'analyse susmentionnes. lesdits kits 
comprenant un polypeptide derive tel que defini ci-dessus, le cas echeant sous forme 
de cristaux susmentionnes, en association avec un ou plusieurs reactifs pour la mise en 
25 ceuvre du procede ou de la methode susmentionnee. 

L'invention sera davantage illustree a l'aide de la description detaillee qui suit de 
la preparation du polypeptide derive hVDR (118-427 A 165-215), et de l f analyse de la 
structure cristalline et des proprietes du polypeptide derive ainsi obtenu. 

Le polypeptide derive represente sur la figure 7 (encore designe mutant LBD 
30 VDR (residus 1 18-427 A 165-215)), a ete prepare sans son domaine d'insertion flexible 

en suppnmant les residus 165 a 2 1 5 de hVDR (Figure la) et en laissant une trentaine de 
residus afin de connecter les helices HI et H3. 
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Le mutant LBD VDR (residus 118-427 A 165-215) a ete surexpnme dans E. coli 
ct purifie par chromatographic d'affinite et d'echange d'ions, et par filtration sur gel, 
selon la methode decrite ci-apres. 

5 A) Expression et purification du mutant LBD VDR 1 18-427 A 165-215 

Le recepteur VDR mute (residus 1 18-427 A 165-215) a etc surproduit sous forme 
de peptide avec un tag hexahistidine. Le cDNA amplifie par PCR a ete sous-clone dans 
les sites Ndel-BamHI du vecteur pET15b (Novagen). Le plasmide a ete ensuite amplifie 

10 dans les bacteries E. coli XL-1 Blue afin de controler la sequence et a ete introduit dans 

les bacteries E. coli BL21DE3 pour la surexpression. Une preculture de 200 ml de LB 
avec 200 jig ampicilline/ml est utilisee pour inoculer 6x 11 de LB contenant 200 \ig 
ampicilline/ml. Les cellules sont cultivees a 37°C jusqu'a une absorbance de 0.6 puis 
l'expression de la proteine est induite par L addition de 1 mM dTPTG dans le milieu de 

15 culture durant 6h a 20°C. Les cellules sont culottees par ultracentrifugation et 

conservees a -80°C. 

Le culot cellulaire rcpresentant 1 1 de culture est repns dans 25 ml de tampon 
contenant 20mM Tris pH8.0, 250 mM NaCl, 5 mM imidazole, 5% glycerol, 0.5 ug/ml 
du cocktail d'inhibiteur de proteases, 1 mM de p-mercaptoethanol et 1 mM de PMSF. 

20 La lyse des cellules s'effectue par sonication et Lextrait brut est obtenu par 

ultracentrifugation a 45 K pendant lh30. La purification s'effecrue en trois etapes. 
L'extrait brut est dans premier temps charge sur une colonne d'affmite metallique 
(Talon, Clonetech). Apres lavage, la proteine est eluee avec un tampon contenant 20 
mM Tris pH8.0, 250 mM NaCl, 150 mM Imidazole et 5% glycerol. La proteine est 

25 ensuite concentree sur Centriprep 30 et diluee avec 4 volumes de tampon 20 mM Tris 

ph7.5, NaCl 50mM et DTT 5 mM. L'echantillon est ensuite charge sur une colonne 
d'echange anionique Q15 (Sartorius) et elue par un gradient de NaCl (0->lM). Afin de 
couper le tag hexahistidine. la proteine est digeree par la thrombine (1 unite par mg de 
proteine) a 4°C pendant 12h en presence de CaC12 5mM. Finalement la proteine est 

30 chargee sur gel de filtration Superdex 75 16/60 (Pharmacia) equilibree avec 10 mM Tris 

pH7.0, 100 mM NaCl, 10 mM DTT et eluee avec ce meme tampon. Le ligand est alors 
ajoute en exces et incube avec la proteine a 4°C durant 12h. Le complexe est alors 
concentre sur Centncon 30 pour la cristallisation. 
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La quantite de proteine purifiee est de 2 mg/'l de culture. La qualite et 
Lhomogeneite de la proteme sont analysees par electrophorese en condition denaturante 
et native. La proteine est pure a plus de 95% et une bande unique est observee sur gel 
natif. La proteine est monomenque selon l'elution de la filtration sue gel et des mesures 
5 de diffusion de lumiere. La concentration en proteine est mesuree par Bradford et par 

spcctrophotometrie. L'echantillon est monodisperse selon les mesures de diffusion de 
lumiere. 



B) Analyse et proprietes du VDR 1 18-427 A 165-215. 

10 

La capacite de la proteine mutante a se Her a l,25(OH) 2 D 3 a etc determinee par la 
methode de Scatchard en utilisant des extraits bruts de la proteine recombinante (Figure 
2a : les analyses de Scatchard ont ete effectuees sur Dextran/charbon; les extraits bruts 
de E. coli BL21 (DE3) exprimant hVDR sauvage ou mutant / pET 15b, ont ete dilues 

15 1000 fois et incubes avec des quantites croissantes ( 3 H-26,27, Amersham) l,25(OH) 2 D 3 

dans Tris 20 mM, NaCl 250 mM, dithiothreitol (DTY) 5 mM, glycerol 10% pendant 16 
heures a 4°C; apres incubation, 25 ul de Dextran/charbon (1,5%) ont etc additionnes a 
25 ul du melange de proteines; apres 5 min les tubes ont ete centrifuges a 13000 rpm 
pendant 5 min; les concentrations de ligand lie (B) ont ete determinees par comptage en 

20 scintillation liquide sur le surnageant; les concentrations en ligand total ont ete mesurees 

par comptage en scintillation liquide sur 15 ^1 du melange de proteines avant addition 
de Dextran/charbon; U represente le ligand non lie; chaque point represente la moyenne 
de trois valeurs; les resultats ont ete analyses par la methode non lineaire de moindre 
carre selon la methode decrite par Claire et al., 1978; la courbe pleme et celle en 

25 pointille correspondent respectivement aux resultats experimentaux obtenus avec le 

polypeptide mutant derive et la proteine sauvage, avec les parametres N = 0,073 + 0,006 
nM, Kd - 0,37 ± 0,05 nM, P - 0,058 ± 0,002 pour le polypeptide mutant derive, et N = 
0,10 + 0,01 nM, Kd = 0,55 + 0,08 nM, p - 0,051 ± 0,003 pour la proteine sauvage, 
avec N = nombre de sites, Kd = constante de dissociation, et p - liaison non specifique; 

30 les experiences ont ete repetes deux fois). 

Aucun changement significatif entre les constantes de dissociation des VDR du 
type sauvage et mutant n'a ete observe, les valeurs etant similaires a celle decntes 
prealablement pour le recepteur entier (Bouillon et al., 1995). Afin de comparer les 
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proprietes de transactivation des deux proteines, les LBD sauvages et mutants ont ete 
fusionnees au domaine de liaison a TADN de l'activateur GAL4 de la levure. Les 
proteines chimeriques ont ete exprimees par transfection dans les cellules Cos, et la 
transactivation a ete mesuree avec un rapporteur approprie repondant a GAL4. Les deux 
5 proteines presentent des proprietes de transactivation comparables dans ce systeme 

(Figure 2b : les LBD de VDR sauvage ou mutant ont ete fusionnes au domaine de 
liaison a l'ADN de l'activateur Gal4 (1-147) de la levure par clonage de l'ADNc dans les 
sites XhoI-BamHI du vecteur PXJ440 (Xiao et al., 1991); les cellules Cos ont ete 
transferees selon la methode decrite par Xiao et al., 1991, avec les vecteurs (250 ng) 

10 contenant les LBD sauvage ou mutant de hVDR avec 2 jig de gene rapporteur 17m5- 

TATA-CAT et 2 ^ig d'un recombinant de controle interne pCHHOlacZ (Pharmacia) 
exprimant la P-galactosidase complete a 20 jig avec un ADN support; les cellules ont 
ete traitees avec EtOH ou l,25(OH) 2 D 3 10" 7 M; les activites CAT, normalisees en unites 
egales de P-galactosidase, sont exprimees par rapport a l'activite CAT (100%) induite 

15 par le VDR sauvage en presence de l,25(OH)2D3). 

Par consequent, la deletion du domaine d'insertion n'a pas d'effet majeur sur la 
liaison du ligand, la transactivation ou la dimerisation avec le LBD de RXRcc. 

La suppression du domaine d'insertion flexible dans le LBD de VDR a conduit a 
une proteine davantage soluble, qui peut etre cristallisee sous forme de complexe avec 

20 L25(OH) 2 D3. Des cristaux ont pu etre obtenus par des techniques de diffusion de 

vapeur en utilisant du sulfate d'ammonium en tant que precipitant. La structure du 
cristal a etc resolue par une combinaison de remplacement moleculaire, en utilisant un 
modele partiel de RARy (Renaud et al. 1995 ; Klaholz et al., 1998), et de remplacement 
isomorphe avec un derive du mercure. Les resultats obtenus sont resumes sur le tableau 

25 Ici-apres. 
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Tableau 1 



Compose 
nature! 



Derive 
thiomersal 



groupe de donnees 

source de rayons X 
longueur d'onde 
10 resolution 

reflexions uniques 
completude 
multiplicity 
Rsym a 

1 5 derniere tranche de resolution 

nombre de sites 
pouvoir de phasage (c/a) 
facteur centnque R 



Hambourg BW7B Laboratoire 
0,8345 A 1,5418 A 

20,0-1,8 A 20,0-2,9 A 

29434 6404 
97,4% 84,9% 
4,1 2,8 
6,1% 9,8% 
24%, 5,06, 93,3% 20,6%, 3,2, 71,4% 
4 

1,33/ 1,72 
53 % 



20 Affinement 

facteur R libre (10% des reflexions)* 21,4% 

facteur R 19,1% 
nombre d'atomes non hydrogene 

proteine 1994 

25 ligand 30 

molecules d'eau 166 

Rmsd sur la longueur de liaison (A) 0,004 

Rmsd sur les angles de liaison (A) 1>083 
moyenne des facteurs B pour les atomes non hydrogene (A') 

30 proteine 3L,0 

ligand 22,3 

eau 45,6 
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(Tableau 1 : les experiences de cnstallisation ont ete effectives a 4°C par la 
methode de diffusion de vapeur a goutte suspendue; la proteine a ete concentree de 4 a 
10 mg/ml; les cristaux de hVDR (1 18-427 A 165-215) complexes a 1,25 (OH) 2 D 3 ont 
ete obtenus en 4 jours a partir d'une solution contenant du sulfate d' ammonium 0,7 M, 
5 tampon Mes 50 mM pH6.0, Tris 5mM, DTT 5mM equilibre contre un reservoir 

contenant du sulfate d'ammonium 1,4 M, Mes 0,1 M pH = 6.0; les enstaux 
appartiennent au groupe d'espace orthorhombique (P2| 2\ 2\) avec a = 45.193 A, b = 
52.443 A , c = 133.286 A, a = p = y = 90 °; l'unite asymetrique contient un monomere; 
le contenu en solvant des cristaux est de 48 %; le facteur B estime par la methode de 

10 Wilson est 29. Le derive a atome lourd a ete obtenu en trempant les cristaux dans du 

Thiormesal (Ethyl mercurylthiosalicylate) pendant 4 jours; les resultats de diffusion aux 
rayons X des cristaux narurels ont ete mesures a 4 °C sur la ligne de faisceau BW7B au 
synchrotron de Hambourg; les resultats ont ete traites en utilisant les logiciels DENZO 
et SCALEPACK (Otwinoswski et al., 1997); les phases initiales ont ete obtenues par 

15 remplacement moleculaire avec AMORE (Navaza et al., 1994), en utilisant le RARy 

comme modele de depart; ce modele contient les helices conservees HI, H3-H5, H7- 
H10 (Figure la); la solution a une correlation de 31 % et un facteur R de 53,6 % apres 
remplacement de corps rigide AMORE; completes par les phases obtenues a l'aide du 
derive mercunel dont les donnees de diffraction ont ete enregistrees sur un detecteur 

20 d'image bidimensionnelle Mar Research au laboratoire a 4° C; les sites derives ont ete 

trouves et affines avec le logiciel SOLVE (Tervilliger et al., 1987). 

La carte obtenue par des phases combinees a ete calculee a une resolution de 3 A 
en utilisant une correction de solvant. L'affmement a ete effecrue avec le logiciel CNS 
(Briinger et al., 1998). Des cycles de construction du modele avec le logiciel O (Jones et 

25 al., 1991) et une minimisation de moindre carre, suivi d'un affinement amsotropique 

individuel de facteur B ont conduit au modele final. Tous les resultats entre 20 et 1 ,8 A 
ont ete inclus dans l'affinement sans seuils de coupure. Les molecules de solvant de la 
premiere couche d'hydratation ont ete localisees avec le logiciel CNS sur une carte F 0 -F c 
a 3 sigma. Les valeurs maximales de facteur B (40-50) correspondent aux residus dans 

30 la boucle avant HI, la jonction ct les boucles H9-H10 et HI 1-H12. La qualite du modele 

final a ete analysee par le logiciel PROCHECK (Laskowski et al., 1993). La distribution 
d'angle Ramachadran indique 92,4 % de conformations les plus favorables, et 7,6 % de 
conformations autonsees. 
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Le modele final contient 250 residus, 166 molecules d'eau et une molecule de 
ligand. Aucune densite claire n'a ete observee pour les deux premiers residus N- 
terminaux et les quatre derniers residus C-terminaux. Trois residus additionnels, 375 a 
377 dans laboucle H9-H10, n'ont pas ete inclus dans 1'affinement en raison de la qualite 
5 moderee de la carte de densite electronique dans cettc region. 

La topologie globale du LBD de VDR (figure lb) est similaire a celle des autres 
LBD de recepteurs nucleaires, avec 13 helices prises en sandwich dans 3 couches et un 
feuillet P a trois bnns. La nomenclature est fondee sur la structure de hRXRa (Bourguet 
et al., 1995). Le domaine reliant les helices HI ct H3 contient deux petites helices H2 et 
10 H3n. La nouvelle helice H3n forme le fond de la structure et remplace la boucle Q dans 

la structure de RARy. La flexibility intrinseque des trois residus glycine (162-164) 
situes a la jonction favorise une adaptation douce. 

Ce fragment de trois residus est plutot eloigne du ligand, et il est par consequent 
peu probable qu'il joue un role dans la liaison au ligand. La structure VDR est plus 
15 proche de celle du RARy complexe a des agonistes. Les proteines se superposent avec 

un rmsd de 1,2 A sur 179 residus (seuil de coupure de 2,5 A sur Ca), les regions 
exclues etant le peptide conncctant HI a 113, le bnn p2, Thelice H6 et quelques boucles 
de connexion. 

La difference la plus notable se situe au niveau de la connexion entre les helices 
20 HI et H3, qui dans le RARy entoure le feuillet p, et dans le VDR suit un chemin entre 

H3 et rextremite du feuillet p, identique a celui de ERa (Brzozowski et al., 1997). Par 
consequent, rextremite du feuillet p est deplacee vers l'exterieur et agrandit la cavite de 
liaison a la vitamine D (Figure 3a et 3b). Tous les brins p ont des residus en contact 
avec le ligand. Dans le brin pi, Trp 286, specifique des recepteurs VDR, joue un role 
25 important dans le positionnement du ligand. II fait partie d'un reseau de liaisons 

hydrogene impliquant Ser 275 qui est elle-meme liee par liaison hydrogene a Gin 317 et 
au carbonyle de Met 272. L'extremite du feuillet p est aussi stabilises par des liaisons 
hydrogenes entre les groupes carbonyles de Glu 292 et Lys 294, ct Arg 158 de la boucle 
de connexion entre les helices H2 et H3n. 
30 L'helice HI 2, dont le positionnement est important pour la liaison de coactivation 

et la transactivation, est en position agoniste (Figure 3c). L'helice est stabihsee dans 
cette orientation par des contacts hydrophobes (lie 268 de H5 et Phe 422 de HI 2) et 
interactions polaires. Dans ces dermeres interactions sont engagees le pont conserve 
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Lys 264-Glu420, et une liaison hydrogene entre Ser 235 de H3 et Thr 415. De plus, les 
groupcs carbonyles de Met 412 et de Leu 414 de la boucle HI 1-H12 sont lies par liaison 
II a Arg 154 (extremite de H12) qui fait lui-rneme des liaisons H avec Asp 232 (H3). 
Tous ces residus sont conserves chez les recepteurs VDR. La mutagenese dirigee des 
5 residus Lys 264 et Glu 420 qui etablissent le pont salin, a permis de reveler que ces 

mutations suppnment la transactivation dependante du ligand, mais n'a pas d'effet sur la 
liaison au ligand, l'heterodimerisation avec RXR ou la liaison a l'ADN (Nakajima et al., 
1998). 

Un fort contact cristallin est observe entre l'helice H3n et les helices H3, H4 et 
10 H12 d'une molecule symetriquement reliee (Figure 3d). H3n mime les contacts du 

peptide SRC1 observes dans le complexe ternaire de PPAR (Nolte et al., 1998), bien 
qu'il ne contienne pas le motif LXXLL trouve chez la plupart des coactivateurs. Cette 
helice est ancree par contacts polaires a travers des liaisons H entre la region N- 
terminale de H3n (Ser 216, Val 217 et Thr 218) et Glu 420 (HI 2). Au niveau de la 
15 region C-terminale de l'helice H3n, Ser 222 est lie par liaison hydrogene a Lys 246 

(extremite de l'helice H3). L'importance fonctionnelle de cette lysine a ete demontree 
par mutation en glycine qui affecte fortement la transactivation (Whitfield et al., 1995). 
Entre les residus Lys 246 et Glu 420, une cavite hydrophobe est formee par les helices 
H3, H4 et H12. Les residus de l'helice H3n (Val 217, Thr 218, Leu 219, Leu 221, et Ser 
20 222) sont en contact par liaison van der Waals avec He 242 (H3), He 260 (H4), Leu 41 7 

et Val 421 (HI 2). Cette observation montre que d'autres sequences que LXXLL doivent 
etre prises en consideration dans le cadre du processus de reconnaissance des recepteurs 
nucleaires. 

La structure du VDR lie a son ligand naturel a permis de resoudre nornbre 
25 d'ambiguites et de questions concernant la conformation de la vitamine D active. La 

comparaison avec la structure cristallographique de la molecule libre de vitamine D 
(Suwinska et al., 1996) montre que les deux ligands ont une conformation identique 
pour les noyaux A, C et D (Figure 4a). La difference la plus appreciable est la geometne 
non planaire du triene conjuguc dans le complexe, qui resulte de la forme courbe du 
30 ligand necessaire a sa fixation au recepteur. La poche de liaison au ligand est bordee de 

residus hydrophobes predominant (Figures 4b et 4c). Le ligand etendu englobe l'helice 
H3 avec son noyau A (Figures 3b et 3c) oriente vers les extremites C-terminales de 
l'helice H5 et le groupe hydroxylc-25 proche des helices H7 et HI 1. Le groupe methyle 
27 forme une faible interaction avec l'helice HI 2 (Val 418). Les distances separant les 
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parties hydroxygle-25 des groupes hydroxyles du noyau A, 1-OH et 3-OH, sont de 13 A 
et de 15,4 A, rcspectivement. 

Dans le complexe, le noyau A adopte une conformation B en chaise avec les 
groupes 1-OH et 3-OH respectivement en orientations equatoriales et axiales. La partie 

5 hydroxyle en position 1 forme deux liaisons H avec Ser 237 (H3) et Arg 274 tandis que 

le groupe 3-OH forme deux liaisons H avec Ser 278 (H5) et Tyr 143 qui est conserve 
uniquement chez les mammiferes. Arg 274 est compris dans un reseau serre de liaisons 
H avec des molecules d'eau et le carbonyle de Thr 142 a l'extremite de HI (Figure 4c). 
Le tnene conjugue (Figure 4a), connectant les noyaux A et C est situe dans un 

10 canal hydrophobe pris en sandwich entre Ser 275 (boucle H5-p) et Trp 286 (pi) sur Tun 

des cotes et Leu 233 (H3) sur l'autre cote. La liaison unique C6-C7 presente une 
conformation trans qui devie de 30 % par rapport a la geometrie planaire. Cette 
deviation expliquc le manque d'activite biologique des analogues ayant une 
conformation trans ou cis de la liaison C6-C7 (Norman et al., 1997). De fa?on 

15 exclusive, des residus hydrophobes entourent cette chaine. Le groupe 25-hydroxyle est 

lie par liaison H a His 305 (boucle H6-H7) et His 397 (HI 1) (Figure 4). Un reseau de 
liaison H autour des residus histidine indique que His 305 et His 397 sont 
respectivement les accepteurs et donneurs de liaison H. Tous les residus impliques dans 
le reseau de liaison H a 1'exception de Ser 306 sont conserves parmi les VDRs. Les 

20 mutants naturels que 1'on trouve dans le rachitisme resistant a la vitamine D, Arg274Leu 

et His305Gln (Knstjansson et al., 1993), confirme le role critique pour la liaison au 
ligand de Arg 274 et His 305, impliques respectivement dans l'ancrage de 1-OH et 25- 
OH. 

Conformement au fait que le ligand 1,25 (OH)2D 3 est plus grand que l'estradiol, la 
25 progesterone et l'acide retinoique tout trans, la poche de liaison au ligand du VDR est 

plus grande (697 A 3 ) (Figure 4d) que celle du ER (369 A 3 ), du PR (427 A 3 ), du RARy 
(421 A 3 ). Toutefois, l'augmentation de taille n'est pas proportionnelle puisque 1.25 
(OH) 2 D 3 occupe seulement 56 % de la liaison au ligand du VDR, en comparaison aux 
63 %, 67 % et 66 % calcules respectivement avec l'estradiol, la progesterone et l'acide 
30 retinoique tout trans. 

Le volume accessible de la cavite des VDR montre une expansion de la poche a 
proximite de la position 2 du noyau A, qui est occupee par deux molecules d'eau et 
represente 40 A 3 . Cet espace additionnel pourrait recevoir le groupe methyle massif du 
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ligand synthetiquc 2a-methyl l,25(OH) 2 D 3 qui en effet presente une affinite de liaison 4 
fois plus importante que le ligand naturel (Fujishima et al., 1998). De plus, l'espace 
additionnel autour de la chalne aliphatique pourrait permettre le logement de differentes 
longueurs de chaine. 

5 Plusieurs analogues de la vitamine D ont ete montres comme se comportant 

differernment du ligand naturel s'agissant de la transactivation et du recrutement de 
coactivateur (Takeyama et al., 1999 ; Rachez et al., 1998). Afin de comprendre cette 
specificite, des etudes preliminaires du modelage du ligand ont ete realisees. Les ligands 
synthetiques possedant une chaine aliphatique plutot ngide en position 17, tel que MC 

10 903 (22ene-26, 27 -cyclopropyl- la, 24S (OH) 2 D 3 ) ou EB 1089 (22,24 diene - 24, 26, 

27 tri-homo la, 25 (OH) 2 D 3 ) (une ou deux double liaisons respectivement), peuvent 
loger dans la poche de liaison avec seulement quelques ajustements mineurs de la 
geometrie de 1,25 (OH) 2 D 3 . Les noyaux C et D doivent seulement etre deplaces afin de 
loger les groupes methyles en position 26 et 27 de EB1089 ou le noyau cyclopropyle de 

15 MC 903. Pour les analogues 20-epi-l,25 (OH) 2 D 3 et KH 1060, seuls les conformeres 

de faible energie, avec une conformation gauche-anti autour de C20, peuvent se loger. 
Avec une telle geometrie, le groupe methyle en C21 pointe dans la meme cavite comme 
le ligand naturel, tandis que le reste de la chaine, du a la combinaison de la 
conformation anti de C20-C22 et de 1'epimerisation de C20, borde le cote oppose de la 

20 cavite de liaison. Cette variation de chemin conduit a differents contacts pour les deux 

epimeres. La distance de la partie 1-hydroxyle jusqu'a la partie 25-hydroxyle est plus 
courte dans l'analogue 20-epi, de sorte que les chaines longues, comme dans le cas de 
KH1060, peuvent loger. Les ligands avec une chaine aliphatique plus longue adopte une 
conformation plus compacte et forment des contacts van der Waals additionnels avec la 

25 cavite de liaison qui peut ensuite stabiliser l'helice en position HI 2 et/ou affecter des 

regions moins rigides de la poche de liaison comme la boucle H6-H7. 

Ces differents contacts avec une cavite de liaison plutot rigide peuvent expliquer 
les differences dans les demi-vies et les activites transcriptionnelles. 

La structure de la vitamine D a fait I'objet de nombreuses etudes ces dix dernieres 

30 annees. La presente invention fournit pour la premiere fois une image de L25 (OH) 2 D 3 

dans sa conformation active. Jusqu'a maintenant, la chaine laterale naturelle de 1,25 
(OH) 2 D 3 a ete la cible principale des modifications chimiques en vue de decouvrir de 
nouveaux ligands agonistes plus specifiques. 
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Le squelette compose des noyaux A a D n'a pas pu etre modifie sans perte de la 
capacite dc liaison au ligand. Les analogues auxquels manquent les noyaux entiers C 
et/ou D rnais ayant un espacement normal des groupes hydroxyles peuvent faire des 
points de contact normaux a l'interieur de la poche de liaison expliquant leur potentiel 
5 biologique normal (Verstuyf et al, 1998). 

Le complexe selon ^invention revele rarrangement tri-dimensionnel de la poche 
de liaison autour de 1,25 (OH)2 D3 et fournit de nouvelles perspectives pour la 
conception de squelettes originaux. 
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REVENDICATIONS 



1. Polypeptides derives du recepteur nucleaire de la vitamine D chez I'homme 
5 ou les differentes especes du regne animal possedant un tel recepteur, ledit recepteur 

nucleaire comprenant un domaine de liaison au ligand, ou LBD, ce LBD contenant un 
domaine d' insertion flexible, lesdits polypeptides derives etant caracterises en ce qu'ils 
comprennent : 

- les sequences peptidiques desdits recepteurs nucleaires dans lesquelles : 

10 * le domaine d' insertion flexible du LBD est modifie par substitution ou 

suppression d'au moins environ 30 acides amines, et de preference d'au moins environ 
40 acides amines, ou de la totalite des acides amines composant ce domaine 
d'insertion, 

* et, le cas echeant, un ou plusieurs ou la totalite des acides amines situes aux 
15 positions 1 a environ 125, notamment aux positions 1 a 117 ou 123, des sequences 

peptidiques desdits VDR, sont modifies par substitution ou suppression, 
lesdits polypeptides derives possedant les caracteristiques suivantes : 

* les proprietes de liaison au ligand et de transactivation du LBD du recepteur 
de la vitamine D sont conserves, 

20 * ils sont stables, a savoir qu'ils peuvent etre conserves, notamment dans du 

NaCl 100 mM a pH 7 pendant au moins environ une semaine, sans que soit pour 
autant affectees les proprietes susmentionnees du LBD, par opposition au LBD non 
rnodifi6 qui est instable dans les conditions susmentionnees, 

* ils sont cristallisables dans des solvants aqueux, notamment a 4°C par la 
25 methode de diffusion de vapeur a goutte suspendue, 

* et, ils sont solubles dans des solvants aqueux, 

- ou les sequences peptidiques derivees des sequences peptidiques definies ci- 
dessus, notamment par suppression, addition ou substitution d'un ou plusieurs acides 
amines, lesdites sequences derivees possedant les caracteristiques mentionnees ci- 

30 dessus desdits polypeptides derives. 
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2. Polypeptides derives selon la revendication 1. caracterises en ce qu'ils 
comprennent les sequences peptidiques des recepteurs nucleaires de la vitamine D 
dans lesquelles est supprime le fragment peptidique delimite : 

- d'une part, par un acide amine situe approximativement a Tune des positions 
5 155 a 175 des sequences peptidiques des recepteurs nucleaires de la vitamine D 

d'origine humaine ou animale, et plus pariiculierement par r acide amine situe a Tune 
des positions 159 a 168 de ces sequences, 

- et, d'autre part, par un acide amine situe approximativement a Tune des 
positions 204 a 225 des sequences peptidiques des recepteurs nucleaires de la vitamine 

10 D d'origine humaine ou animale. 

3. Polypeptides derives selon la revendication 1 ou 2, lesdits polypeptides 
derives etant choisis parmi ceux comprenant : 

- la sequence en acides amines delimitee par les acides amines situes aux 
15 positions 118 et 427, ou aux positions 124 et 427 des sequences peptidiques des VDR 

d'origine humaine ou animale, et dans laquelle les residus situes aux positions 165 a 
215 desdites sequences peptidiques des VDR sont supprimes, 

- ou une sequence peptidique derivee de la sequence en acides amines 
susmentionnee, notamment par suppression, addition ou substitution d'un ou plusieurs 

20 acides amines, ladite sequence derivee possedant les caract£ristiques mentionnees dans 

la revendication 1 dudit polypeptide derive. 

4. Polypeptides derives selon Tune des revendications 1 a 3, choisis parmi les 
polypeptides SEQ ID NO : 4, SEQ ID NO : 6, et SEQ ID NO : 8. 

25 

5. Cristaux comprenant un polypeptide selon Tune des revendications 1 a 4, lc 
cas echeant en association avec la vitamine D, ou un analogue agoniste ou antagoniste 
de la vitamine D. 



30 6. Sequence nucleotidique codant pour un polypeptide selon Tune des 

revendications 1 a 4. 
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7. Sequence nucleotidique selon la revendication 6, choisie parmi : 

- les sequences SEQ ID NO : 3, SEQ ID NO : 5 et SEQ ID NO : 7, 

- ou une sequence nucleotidique derivee par degenerescence du code genetique 
des sequences nucleotidiques susmentionnees, et codant pour un polypeptide derive du 

5 hVDR selon la revendication 4, 

- ou une sequence nucleotidique derivee des sequences nucleotidiques 
susmentionnees, notamment par substitution, suppression ou addition d'un ou plusieurs 
nucleotides, et codant pour une sequence peptidique derivee des polypeptides derives 
du hVDR definis ci-dessus, et possedant les caracteristiques mentionnees selon la 

10 revendication 1 desdits polypeptides derives. 



8. Sequence nucleotidique recombinante comprenant une sequence nucleotidique 
selon la revendication 6 ou 7 en association avec les elements necessaires a la 
transcription de cette sequence, notamment avec un promoteur et un terminateur de 

15 transcription. 

9. Vecteur, notamment plasmide, contenant une sequence nucleotidique selon 
Tune des revendications 6 a 8. 



20 10. Cellules hotes transformees par un vecteur selon la revendication 9, lesdites 

cellules etant choisies notamment parmi les bacteries telles que E. coli, ou les cellules 
d'insectes susceptibles d'etre infectees par un baculo virus. 



11. Procede de preparation d'un polypeptide selon l'une des revendications 1 a 
25 4, caracterise en ce qu'il comprend les Stapes suivantes : 

- transformation de cellules a 1'aide d'un vecteur recombinant selon la 
revendication 9, 

- mise en culture des cellules ainsi transformees, et recuperation dudit 
polypeptide produit par lesdites cellules, le cas echeant apres purification. 

30 

12. Utilisation d'un polypeptide selon Tune des revendications 1 a 4, ou de 
cristaux selon la revendication 5, pour la mise en ceuvre d'une methode de criblage 
d' analogues de la vitamine D. 
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13. Utilisation selon la revendication 12, pour la mise en oeuvre d'une methode 
de criblage d'analogues agonistes ou antagonistes de la vitamine D susceptibles d'etre 
utilises dans des compositions pharmaceutiques, notamment dans le cadre du 

5 traitement de pathologies cancereuses, du psoriasis, des maladies auto-immunes, de 

l'osteodystrophie ou de l'osteoporose. 

14. Methode de criblage d'analogues de la vitamine D, caracterisee en ce qu'elle 
comprend les etapes suivantes : 

10 - mise en presence d'un polypeptide selon Tune des revindications 1 a 4, ou de 

cristaux selon la revendication 5, avantageusement lie a un support solide, avec 
l'analogue teste, l'un dudit polypeptide ou de l'analogue de la vitamine D etant 
avantageusement marque, notamment a 1'aide d'un marqueur fluorescent, radioactif ou 
enzymatique, 

15 - detection de l'eventuelle liaison entre ledit polypeptide, ou lesdits cristaux, et 

I' analogue teste par mesure du marqueur utilise, notamment apres rin^age du support 
utilise lors de l'etape precedente. 

15. Utilisation d'un polypeptide selon l'une des revindications 1 a 4, ou de 
20 cristaux selon la revendication 5, pour la mise en oeuvre d f une methode d' analyse de 

la structure tridimensionnelle des complexes formes entre ledit polypeptide, ou lesdits 
cristaux, et une molecule determinee. 

16. M6thode d' analyse de la structure tridimensionnelle des complexes formes 
25 entre un polypeptide selon l'une des revendications 1 a 4, ou de cristaux selon la 

revendication 5, et une molecule determinee, ledit procede comprenant les etapes 
suivantes : 

- mise en presence dudit polypeptide derive, ou desdits cristaux, avec la 
molecule determinee, 

30 - cristallisation du complexe forme entre ledit polypeptide derive, ou lesdits 

cristaux, et la molecule determinee, notamment par diffusion de vapeur, et analyse 
tridimensionnelle dudit complexe notamment par remplacement moleculaire, 
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- ou analyse tridimensionnelle dudit complexe en phase soluble, notamment par 
RMN. 
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FIGURE lb 



FIGURE 1 (suite) 
FEUILLE DE REMPLACEMENT (REGIE 26) 
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FIGURE 2b 
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FIGURE 2 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 3 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 3c 




FIGURE 3 (suite) 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 4a 
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FIGURE 4 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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FIGURE 4 (suite) 
FEUILLE DE REMPLACEMENT (REGLE 26) 
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atg gag gca atg gcg gcc age act tec ctg cct 3a c c;:t gga gac tt: 4 8 

Met Glu Ala Met Ala Ala Ser Thr Ser Leu Pro Asp Fro Hy Asp ?ne 
1 5 10 15 

gac egg aac gtg ccc egg ate tgt ggg gtg tgt gga gac cga gcc act it 

Asp Arg Asr. Val Pro Arg He Cys Gly Val Cys Gly Asp Arg Aid Thr 
20 25 30 

ggc ttt cac ttc aat get atg acc tgt gaa ggc tgc aaa gcc tec ttc 144 

Gly ?he His ?he Asn Ala Met Thr Cys Glu Gly Cys Lys Gly Phe Phe 
3d 40 45 

agg cga age atg aag egg aag gca eta ttc acc tgc ccc ttc aac ggg 192 

Arg Arg Ser Met Lys Arg Lys Ala Leu Phe Thr Cys Pro Phe Asn Gly 
50 55 60 

gac tgc cge ate acc aag gac aac cga cgc cac tgc cag gcc tgc egg 240 

Asp Cys Arg lie Thr Lys Asp Asn Arg Arg His Cys Gin Ala Cys Arg 

65 7 0 7 5 8 0 

etc aaa cge tgt gtg gac ate ggc atg atg aag gag ttc att ctg aca 288 

Leu Lys Arg Cys Val Asp He Gly Met Met Lys Glu Phe He Leu Thr 
85 90 95 

gat gag gaa gtg cag agg aag egg gag atg ate ctg aag egg aag gacj 336 

Asp Glu Glu Val Gin Arg Lys Arg Glu Met lie Leu Lys Arg Lys Glu 
100 ' ~ 105 110 

gag gag gcc tt 3 aag cac agt ctg egg ccc aag ctg tct gag gag cag 384 

Glu Glu Ala Leu Lys Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin 
115 120 125 

cag cgc ate att gcc ata ctg ctg gac gcc cac cat aag acc tac gac 432 

Gin Arg He He Ala He Leu Leu Asp Ala His His Lys Thr Tyr Asp 

130 135 140 

ccc acc tac tec gac ttc tgc cag ttc egg cct cca gtt cgt gtg aat 450 

Pro Thr Tyr Ser Asp Phe Cys Gin Phe Arg Pro Pro Val Arq Val Asn 

145 150 155 16C 

gat ggt gga ggg acc cat cct tec agg ccc aac tec aga cac act ccc 528 

Asp Gly Gly Gly Ser His Pro Ser Arg Pro Asn Ser Arg His Thr Pre 
165 170 175 

age ttc tct ggg gac tec tec tec tec tgc tea gat cac tgt ate acc 576 

Ser Phe Ser Gly Asp Ser Ser Ser Ser Cys Ser Asp His Cys He Thr 
180 " 185 190 

tct tea gac atg atg gac teg tec age ttc tec aat ctg gat ctg agt 624 

Ser Ser Asp Met Met Asp Ser Ser Ser Phe Ser Asn Leu Asp Leu Ser 
195 200 205 



Figure 5 
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gaa caa car tea gat gac cct gtg acc eta gag ctg tec cag etc 672 

Glu Glu Asp Ser Asp Asp ?r .0 Ser Val Thr Leu Glu Lee Ser Gin Lei; 

210 '215 220 

tec atg ctg cce eac ctg get gac 0:5 gtc agt tac ag: ate caa aag "720 

Ser Met Leu Fro His Leu Ala Asp Leu Val Ser Tyr Ser lie Gin Lys 

225 230 235 240 

gtc att ggc ttt get aag atg ata cca gga ttc aga gac etc a:c tct 763 

Val lie Gly Fhe A: a Lys Met He Pro Gly ?he Arg Asp Leu Thr Ser 

245 250 255 

gag gac cag ate gta ctg ctg aag tea agt gec att gag gtc ate atg 316 

Glu Asp Gin He Val Leu Leu Lys Ser Ser Ala lie Glu Val lie Met 

260 265 270 

ttg cgc tec aat gag tec ttc acc atg gac gac atg tec tgg acc tgt 864 

Leu Arg Ser Asn Glu Ser Phe Thr Met Asp Asp Met Ser Trp Thr Cys 

27b 280 235 

ggc aac caa gac tac aag tac cgc gt 2 agt gac gtg azc aaa gee gga 911 

Gly Asn Gin Asp Tyr Lys Tyr Arg Val Ser Asp Val Tnr Lys Ala Gly 

290 295 300 

cac age ctg gag ctg att gag ccc etc ate aag ttc cag gtg gga ct 5 960 

His Ser Leu Glu Leu He Glu Pro Leu He Lys Phe Gin Val Gly Leu 

305 310 315 320 

aag aag ctg aac ttg cat gag gag gag cat gtc ctg etc atg gec ate 1003 

Lys lys Leu Asn Leu His Glu Glu Glu His Val Leu Leu Met Ala He 

32 5 330 335 

tgc ate gtc tec cca gat cgt cct ggg gtg cag gac gec gcg ctg at: 1056 

Cys lie Val Ser Pro Asp Arg Pro Gly Val Gin Asp Ala Ala Leu He 

340 345 350 

gag gc: ate cag gac cgc ctg tec aac aca ctg cag a eg tac ate cgc 1104 

Glu Ala He Gin Asp Arg Leu Ser Asn Thr Leu Gin Thr Tyr He Arg 

355 360 365 

tgc cgc cac cc 3 cc: ccg ggc age cac ctg etc tat gec aag atg ate 1152 

Cys Arg His Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys Met He 

370 37 5 380 

cag aag eta gec gac ctg cgc age etc aat gag gag cac tec aag cag 12C0 

Gin Lys Leu Ala Asp Leu Arg Ser Leu Asn Glu Glu His Ser Lys Gin 

385 390 395 400 

tac cgc tgc etc tec ttc cag cct gag tgc acc atg aag eta acg ccc 1248 

Tyr Arg Cys Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu Thr Pro 

4 05 4 10 415 

ctt gtg etc gaa gtg ttt ggc aat gag ate tec tga 1284 

Leu Val Leu Glu Val Phe Gly Asn Glu He Ser 

420 425 



Figure 5 (suite 1 ) 
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atg gag gc^ at a gcg gee age act tec ctg ::: gas cct gga gac ttt '18 

Met Glu A! -3 Met Ala Ala Ser Thr Ser Lei Pre Asp Pre 31y Asp Phe 

15 13 15 

gac egg aae gtg eee egg ate tgt ggg gt j tgt gga gae cga gse act 96 

Asp Arg Asn Va 1 Pro Arg Me Cys Gly Va L Cys 3iy Asp Arg Ala Thr 

20 25 30 

ggc ttt cae ::: aat get atg acc tgt ga a ggc tge aaa ggc tte ttc 14 4 

Gly Phe His Phe Asn Al 3 Met Thr Cys Gla Gly cys Lys Gly Phe Phe 

35 10 45 

age cga age atg aag egg aag gca eta ttc acc tge cc 2 ttc aac ggg 192 

Arg Are Ser Met Lys Arg Lys Ala Lea Phe Thr Cys Pre Phe Asn Gly 

50 ' 55 60 

gac tg: cgc at z acc aag gae aa: cga ear cac tgs cag gec tec egg 24 0 

Asp Cys Arg He Thr L/s Asp Asn Arg Arg His Cys Gin Ala Cys Arg 

65 70 7 5 80 

stc aaa cgc tgt gtg gac ate gg^ atg atg aag gag ttc att ctg aca 288 

I.eu Lys Arg Cys Val Asp He Gly Met Met Lys Glu Phe lie Lea Thr 

85 9D 35 

gat gag gaa gtg cag a gg aag :gg gag atg ate ctg aag rgg aag gag 33 6 

Asp Glu Gla Val Gin Arg Lys Arg Gla Met He Leu Lys Arg Lys Glu 

100 105 110 

gag gag gsc ttg aag gac agt ctg egg ccc aag ctg tct gag gag cag 3B4 

Glu Glu Ala Leu Lys Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin 

115 ' 120 125 

cag cgc ate att gec ata ctg ctg gar ges cac cat aag acc tac gac 432 

Gin Arg Tie lie Ala lie Leu Leu Asp Ala Kis His Lys Thr Tyr Asp 

130 135 14C 

ccc acc tac tec gac ttc tge cag 1 1 : egg cct eca gtt rgt gtg aat 430 

Fro Thr Tyr Ser Asp Phe Cys Gin Phe Arg Pro Pro Val Arg Val Asn 

145 " 150 155 160 

gat ggt: gga ggg age gtg acc eta gag ctg tec cag etc tec atg ctg 528 

Asp Gly Gly Gly Ser Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu 

165 170 175 

ccc cac ctg get gac ctg gtc agt tac age ate caa aag gtc att ggc 576 

Pro His Leu Ala Asp Leu Val Ser Tyr Ser He Gin Lys Val lie Gly 

180 135 190 

ttt get aag atg ata eca gga ttc aga gac etc acc tct gag gac cag 624 

Phe Ala Lys Met He Fro Gly Phe Arg Asp Leu Thr Ser Glu Asp Gin 

195 ^ 200 205 



Figure 6 
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ate at a erg c t q a a a tea apt c:c a 1 1 gag etc ate a t g 1 1 g c g e tee 672 

He Val Leu Lee Lys Ser Ser Al a He Glu Va 1 He Met Lea Are Ser 

.-10 215 22C 

aat gag tec ttc aee atg gae gae atg tec tgg aee tgt ggc aac caa 720 

Asn Glu Ser ?he Thr Met Asp Asp Ket Ser Trp Thr Cys Gly Asn Gin 

225 230 235 240 



gae tae aag tae cge gte agt gae gtg aee aaa gee gga eac age ctg 
Asp Tyr Lys Tyr Arg Va L Ser Asp Val Thr Lys Ala Gly His Ser Lea 
24 5 2 50 255 



gaa gtg ttt ggc aat gag ate tzz tga 
Glu Val Phe Gly Asn Glu He Ser 
37 0 37 5 



7 68 



gag etg att gag cce etc ate aag ttc eag gtg gga ctg aag aag ctg 816 

Glu Leu He Glu Pro Leu He Lys Phe Gin Val Gly Leu Lys Lys Leu 

260 265 270 

aac ttg tat gag gag gag eat gte etg :tc atg gee ate tgc ate gtc 8 64 

Asn Leu His Glu Glu Glu His Val Leu Leu Met Ala lie Cys He VaJ 

275 23D 285 

tec :ca gat eg*, cct. ggg gtg cag gae gee geg ctg ate gag gec ate 912 

Ser Pro Asp Arg Pro Gly Val Gin Asp Ala Ala Leu He Glu Ala lie 
290 295 300 

cag gae egc etg tee aac aca ctg eag aeg tae ate ege tgc cge eac 960 

Gin Asp Arg Lei; Ser Asn Thr Leu Gin Thr Tyr lie Arg Cys Arg His 
305 310 3h 320 

ccg cce ceg ggz age eac ctg cte tat 'gee aag atg ate eag aag eta 1008 

Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys Met lie Gin Lys Leu 
325 330 335 

gec gae ctq cue age etc aat gag gag cac tec aag cag tac cge tgc 1056 

Ala Asp Leu Are Ser Leu Asn Glu Glu His Ser Lys Gin Tyr Arg Cys 

340 345 350 

etc tee ttc eag cct gag tgc age atg aag eta aeg cce ctt gtg etc 1104 

Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu Thr Pro Leu Val Leu 

355 360 365 



1131 



Figure 6 (suite 1) 
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cac agt c:q egg ccc aag erg gag gag cag cag cgc ate at t gee 

Asp Ser Leu Arg Pre I.ys Leu Ser Glu Giu Gin Gin Arg He He Ala 
1 5 10 1: 



4 8 



ata etg ct g gae gee cae tat aag ate tae gae etc aee tat tec cac 36 

;ie Leu Leu Aso Ala Kis His Lys Tnr Tyr Asp Pro Thr Tyr Ser Asp 

2 J 2 5 30 

tte tgc cag ttt egg cet tea gtt cgt gtg aat ga: gge gga ggg tet 14 4 

Fhe Cys Gin Phe Arg Pro Pro Val Arg Va 1 Asn Asp Gly Gly Gly Ser 

3 5 4 0 4 5 

qtg acc eta gag ct g tee cag etc tec atg etg ccc tae etg get gae 192 

Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu Pro His Leu Ala Asp 

50 55 6C 

etg etc agt tae age att eaa aau gte att gge tt.t get aag acc ata 24 0 

Leu Val Ser Tyr Ser Ho Gin Lys Val He Gly Phe Ala Lys Met He 

65 7 1 7 5 80 

cca gga tte aga gae etc ace tct gag gae cag at? gta etg etg aag 288 

Pro Gly Phe Arg Asp Leu Tnr Ser Glu Asp Gin He Val Leu Leu Lys 

8 5 90 9 5 

tea agt gee att yaq ate ate atg ttg cgc tec aat gag tec tte ac: 336 

Ser Ser Ala He Glu Val He Met Leu Arg Ser Asn Glu Ser Fhe Thr 

100 105 110 

atg gae gae atg tec tgg aee tgt gge aae oua ga : tae aag tae eg'-; 364 

Met Asp Asp Met Ser Trp> Thr Gys Gly Asn Gin Asp Tyr Lys Tyr Arg 

115 120 125 

gte agt gae etg ace aaa gee gga cac age etg gag etg att gag ccz 4 32 

Val Ser Asp Val Thr Lys Ala Gly His Ser Leu Glu Leu He Glu Pro 

130 135 14 0 

etc ate aag ttt cag etg gga etg aag aag etg aae ttg cat gag gag 480 

Leu He Lys Phe Gin Val Gly Leu Lys Lys Leu Asn Leu Has Glu Glu 

145 150 155 160 

gag cat gte etg etc atg ccc ate tgc ate gte tee cca gat cgt cct 523 

Glu His Val Leu Leu Met Ala He Cys He Val Ser Pro Asp Arc Pre 

165 170 175 

egg gtg cag cac gee geg etg ate gag gee ate cag gae cgc etg tec 576 

Gly Val Gin Asp Ala Ala Leu He Glu Ala He Gin Asp Arg Leu Ser 

180 185 190 

aae aca etg cag acg tae ate cgc tgc cgc cac ecg eee cca age age €2 4 

Asn Thr Leu Gin Thr Tyr He Arg Cys Arg His Pro Pro Pro Gly Ser 

195 200 205 



Figure 7 
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cac ctg etc tat gec aag at g ate cag aag eta gee gac ctg cgc age 672 

His Leu Leu 7yr Ala Lys Met He Gin Lys Leu Ala Asp Leu Are Ser 
210 '215 220 

etc aat gag gag cac tee aag cag tac cgc tgc etc zee ttc cag cct V2C 

Leu Asn Glu Glu His Ser Lys Gin Tyr Arg Cys Leu Ser ?ne Gin Pro 
225 230 235 240 

gag tgc age atg aag eta acg cce ctt gtg etc gaa gtg ttt ggc aat 768 

Glu Cys Ser Met Lys Leu Thr Pro Leu Val Leu Glu Val Phe Giy Asn 
245 250 255 

gag ate tec tga 780 

Glu He Ser 



Figure 7 (suite 1) 
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ctg tct gag gag cag cag zgc ate att gee ata etc etc gac gee cae 48 
Leu Ser Glu Clu Gin Gin Arg He lie Ala He Leu Leu Asp Ala His 
1 5 10 15 

cat aag ace tae gac ccc ace tac tec ga^ ttc tge cag tte egg cct 96 
His Lys Thr Tyr Asp Pro Thr Tyr Ser Asp Fne Cys Gin Phe Arg Pro 
20 25 30 

cca get cgt gt g aat gat ggt gga g<gg age gig ace eta gag ctg tec 14 4 
Pro Vai Arg Va 1 Asn Asp Gly Gly Gly Ser Val Thr Leu Giu Leu Ser 
35 40 45 

cag etc tee atg ctg ccc eac ctg get gac ctg etc agt tae age ate 192 
Gin Leu Ser Met Leu Pro His Leu Ala Asp Leu Val Ser Tyr Ser He 
50 55 60 

caa aag gte att ggc ttt get aag atg ata cca gga tte aga gac etc 240 
Gin Lys Val He Gly Phe Ala Lys Met He Pro Gly Phe Arg Asp Leu 
65 70 75 80 

ace tct gag gac cag ate gta ctg ctg aag tea agt gee att gag gtc 288 
Thr Ser Glu Asp Gin He Val Leu Leu Lys Ser Ser Ala He Glu Val 
85 90 95 

ate atg ttg cge tec aat gag tec ttc ace atg gac cae atg tee tgg 336 
He Met Leu Arg Ser Asn Giu Ser Phe Thr Met Asp Asp Met Ser Trp 
100 105 110 

acc tgt ggc aac caa gac tac aag tac cge gte agt gac gtg ace aaa 384 
Thr Cys Gly Asn Gin Asp Tyr Lys Tyr Arg Val Ser Asp Vai Thr Lys 
115 120 125 

gee gga cae age ctg gag ctg att gag ccc etc ate aag ttc cag gtg 432 
Ala Gly His Ser Leu Giu Leu He Glu Pro Leu lie Lys Phe Gin Vai 
130 135 140 

gga ctg aag aag ctg aac ttg cat gag gag gag cat gtc ctg etc atg 480 
Gly Leu Lys Lys Leu Asn Leu His Glu Glu Glu His Val Leu Leu Met 
145 ^ 150 155 160 

gee ate tgc ate gtc tec cca gat cgt cct ggg gtg cag gac gee gee 52£- 
Ala He Cys He Val Ser Pro Asp Arg Pro Gly Val Gin Asp Ala Ala 
165 170 175 

ctg ate gag gee ate cag gac cge ctg tec aac aca ctg cag acc tac 576 
Leu He Glu Ala He Gin Asp Arg Leu Ser Asn Thr Leu Gin Thr Tyr 
ISO ' 185 190 

ate cge tge cge cac ccg ccc ccq gee age cae etq etc tat gee aag 624 
He Arg Cys Arg His Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys 
195 200 205 



Figure 8 
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atg ate cag aag eta gec gac ctg ccc age etc aat gag gag cac tee 6 7 2 

Met Tie Gin Lys Leu Ala Asp Leu Arg Ser Leu Asn Glu Glu His Ser 

210 21S 220 

aag eag tac cgc tgc etc tec tte cag set gag tgc age atg aag eta 720 

Lys Gin Tyr Arg Cys Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu 
225 230 235 240 

acg ccc ctt gtg etc gaa gtg ttt gge aat gag ate tec tga 762 

Thr Pro Leu Val Leu Glu Val Phe Gly Asn Glu lie Ser 
245 250 



Figure 8 (suite 1) 
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lists :e sequences 

• 110 > CKRS 

vl2Q.* FCLYFEPTIDES DERIVES CU RECEPTEUR NUCLEAIRE CE LA 

V'TAMINE D, ET LEURS UTILISATION'S NOTAMMENT DANS LE 

:adre D : J CRIBLAGE d 1 analogues LE LA VI 7. amine c 
< 130:- WCB 9 9 CNR VI D3 



. MO • 
- Ml/ 



- 150> F=9914633 

- 151.' 1^99-11-22 



• lbO> 8 



'■nO> Patentln Ver . 2. 1 



•-2io> 1 
< 2 : 1 • 1284 

*-2I2.- ACN 

'■21'?:-* Homo sapiens 



<'2 20> 

<221> CDS 

v222v (1) . . (1281) 



<400^ 1 

at.g ijaq gca at.g geg gcc age act tec ctg cct cac cct gga gac ttt 48 

Met. Glu Ala Met Ala Ala Ser Thr Ser Leu Pro Asp Pre Gly Asp Phe 

5 10 15 



gac egg aac gtg ccc egg ate tgt ggg gtg tgt gga gac cga gee act 96 
Asp Arg Asn Val Pro Arg lie Cys Gly Val Cys Gly Asp Arg Ala Thr 
20 25 30 



ggc ttt cac ttc aat get atg acc tgt gaa ggc tgc aaa ggc ttc tte 144 
Gly Phe His Phe Asn Ala Met Thr Cys Glu Gly Cys Lys Gly Phe Phe 
35 40 45 



age cga age atg aag egg aag gca eta ttc acc tgc ccc ttc aac ggg 192 
Arg Arg Ser Met Lys Arg Lys Ala Leu Phe Thr Cys Pro Phe Asn Gly 
50 "55 60 



gac tgc cgc ate acc aag gac aac cga cgc cac tgc cag gee tgc egg 240 
Asp Cys Arg lie Thr Lys Asp Asn Arg Arg His Cys Gin Ala Cys Arg 
65 ' 70 75 80 



etc aaa cgc tgt gtg cac ate ggc atg atg aag gag ttc att ctg aea 28: 
Leu Lys Arc Cys Val Asp He Gly Met Met Lys Glu Phe He Leu Thr 

8 5 90 95 



gat gag qaa gtg cag acq aag egg gag atg ate ctg aag egg aag gag 
Asp Glu Glu Vai Gin Arg Lys Arg Glu Met lie Leu Lys Arg Lys Glu 
100 1C5 110 



gag gag gcc ttg aag gac agt ctg egg ccc aag ctg tct gag gag cag 384 
Glu Glu Ala Leu Lys Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin 
115 120 125 
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caQ cge ate att gee a:a etc ctg gac gee cac cat aag ac: t:: gac 432 
■j In Arg lie lie Ala lie Leu Leu Asp Ala His His Lys Thr Ty: Asp 
13C 135 140 

:cc ass tac tec gac t:: tgc cag etc egg cct cca gtt cat gee ast 4 80 
Pro T'nr Tyr Ser Asp Fr.e Cys Gin ?ne Arg Pro Fro 7a 1 Arg Va_ Asn 
14 5 15 j 155 160 

gat rat gga gg:j age eat. czt toe agg cec aac tee aga cac act ceo 52 ^ 
Aso Sly Sly Sly Ser His Pro Ser Arg Pro Asn Ser Arg His Thr Fro 
165 170 175 

age etc tct ggg qac tec tec tec tec tgc tea gat cac tgt ate ace 5^6 
Ser Foe Ser Sly Asp Ser Ser Ser Ser Cys Ser Asp His Cys lie Thr 
180 185 190 

tct tea gac atg atg gac t:g tec age ttc tec aat ctg gat ctg agt 624 
Ser Ser Asp Met Met Ast' Ser Ser Ser Phe Ser Asn Leu Asp Leo. Ser 
195 200 205 

gaa gaa zjat tea gat gac cet tct gtg acc eta gag ctg tec cag etc 6 n 2 
Glu jlu Asp ^er Asp Asp Pro Ser Val Thr Leu Glu Leu Ser Gin Leu 
210 ' * 215 220 

tec atg coo; :c: cac ctg get gac ctg gtc agt tac age ate caa aag 720 
Ser Met Leu Pro His Leu Ala Asp Leu Val Ser Tyr Ser lie Gin Lys 
225 230 235 240 

gtc att ggc ttt get aag atg ata oca gga ttc aga gac etc ace tct 7 68 
Val He Sly Phe Ala Lys Met lie Pro Giy Phe Arg Asp Leu Thr Ser 
245 250 255 

aag gac cag ate gta ctg ctg aag tea agt gee att gag gtc ate atg 916 
Glu Asp Jin He Val Leu Leu Lys Ser Ser Ala He Glu Val He Met 
260 265 270 

ttg cge tee aat gag tec ttc acc atg gac gac atg tec tgg acc tgt 8 64 
Leu Arg Ser Asn Glu Ser Fr.e Thr Met Asp Asp Met Ser Trp Thr Cys 

27b 280 235 

ggc aac caa gac tac aag tac cge gtc agt gac gtg acc aaa gee gga 912 
Gly Asn Gin Asp Tyr Lys Tyr Arg Val Ser Asp Val Thr Lys Ala Giy 
290 295 " 300 

cac age ctg gag ctg att gag ccc etc ate aag ttc cag gtg gga ctg 960 
His Ser Leu Glu Leu He Glu Pro Leu He Lys Phe Gin Val Giy Leu 
305 310 315 320 

aag aag ctg aac ttg cat gag gag gag cat gtc ctg etc atg gee ate 1008 
Lys Lys Leu Asn Leu His Glu Glu Glu His Val Leu Leu Met Ala lie 
325 330 335 

tgc ate gtc tec cca gat cgt cct ggg gtg cag gac cec gcg ctg ate 1056 
Cys lie Val Ser Fro Asp Arg Fro Giy Val Gin Asp Ala Ala Leo He 
3 4 0 34 5 3 50 

gag cec ate rag gac cge org tec aac aea ctg cag a eg tac aoc cge 1104 
Glu Ala He Gin Asp Arg Leu Ser Asn Thr Leu Gin Thr Tyr lie Arg 
355 360 565 
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tgc cqz eat cog c... 

Cys Ar 3 hi : s r Pr: Pro 31 y Scr His Leu Leu Tyr A- a Lys Met lie 
37: 375 380 

:ag aag eta gee qae ct g tec age etc aat gag gag eac tee aag eag 1200 

Gin Lye Leu Ala Asp Leu Are Ser Leu Asn Glu Glu His Ser Lys Gin 
33 5 3?C 395 4 CO 

tac eg.: tee etc tee tt. 2 2ag eet gag tgc age atg aag eta aeg cce 124 3 

Tyr An Cys Leu Ser Phe Gl n Pro Glu Cys Ser Met Lys Leu Thr Pro 

4 3 5 4 10 415 

ett gt ^ etc gaa gtg ttr. ;gc aat gag ate tec tea 1284 

Leu 7a i Leu Glu Val Phe Gly Asn Glu lie Ser 

4 20 4 25 



<210'> 2 
<211 > 427 
<212 > PPT 

'213 > Hoir.o sapiens 
<4 00 > 2 

Met Glu Ala Met Ala Ala Ser Thr Ser Leu Pro Asp Pro Gly Asp Phe 
1 5 10 15 

Asp Arg Asn Val Pro Are lie Cys Gly Val Cys Gly Asp Arg Ala Thr 

20 25 30 

Gly Phe His Phe Asn Ala Met Thr Cys Glu Gly Cys Lys Gly Phe Phe 
35 40 45 

Are Ar 5 Ser Met Lys Arg Lys Ala Leu Phe Thr lys Pro Fhe Asn Gly 
50 55 60 

Asp Cy.s Arg lie Thr Lys Asp Asn Arg Arg His Cys Gin Ala Cys Arq 
65 ' 70 75 ' 80 

Leu Lys Arg Cys Val Asp lie Gly Met Met Lys Glu Phe lie Leu Thr 

85 90 95 

Asp Glu Glu Val Gin Arg Lys Arg Glu Met lie Leu Lys Arg Lys Glu 
100 105 110 

Glu Glu Ala Leu Lys Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin 
115 " 120 125 

Gin Ar : lie lie Ala lie Leu Leu Asp Ala His His Lys Thr Tyr Asp 
130 135 140 

Pro Thr Tyr Ser Asp Phe Cys Gin Phe Arg Pro Pro Val Arg Val Asn 
14 5 * 150 155 160 

Asp Gly Gly Gly Ser His Pro Ser Arg Pro Asn Ser Arg His Thr Pro 
165 170 175 

Ser Phe Ser Gly Asp Ser Ser Ser Ser Cys Ser Asp His Cys lie Thr 
130 195 190 

Ser Ser Asp Met Met Asp Ser Ser Ser Phe Ser Asn Leu Asp Leu Ser 
195 20C 205 
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Glu Asp 
2IC 



Se: Asr A.s o Fro Ser VaJ Thr 



Glu Leu 

220 



Ser Met Leu Pro His Leu Ala Asp Leu Val Ser Tyr Ser lie Gin Lys 
225 23C 235 240 

Val lie Gly ?he Ala Lys Met. lie Pro Gly Phe Arq Asp Leu Thr Ser 
24: ' 25G 255 

Glu Asc Gin He Val Leu Leu Lys Ser Ser Ala lie Glu Val He Met 

26C 265 27G 

Leu Arg Ser Asn Glu Ser Phe Thr Ket Asp Asp Met Ser Trp Thr Cys 
275 280 285 

Gly Asn Gin Asp Tyr Lys Tyr Arq Val Ser Asp Val Thr Lys Ala Gly 
290 295 300 

Hi 5 Ser Leu GLu Leu lie Glu Pro Leu He Lys Phe Gin Val Gly Leu 
30 . c 310 31 5 320 

Lys Lys Leu Asn Leu His Glu Glu Glu His Val Leu Leu Met Ala He 

32: 330 335 

Cys He Val Ser Pro Asp Arq Pro Gly Val Gin Asp Ala Ala Leu He 
34 0 34 5 350 

Glu Ala lie Gin Asp Arq Leu Ser Asn Thr Leu Gin Thr Tyr He Arg 
355 360 365 

Cys Arg His Pro Fro Pro Gly Ser His Leu Leu Tyr Ala Lys Met He 
370 375 3S0 

Gin Lys Leu Ala Asp Leu Arg Ser Leu Asn Glu Glu His Ser Lys Gin 
38 5 3 90 3 95 4 00 

Tyr Arg Cys Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu Thr Pro 
4 05 4 10 415 

Leu Val Leu Glu Val Foe Gly Asn Glu He Ser 
4 20 425 



<210> 3 
<211> 1131 
<212> ADN 

<:2 13> Sequence artificielle 
<220> 

<:223> Description de la sequence artificielle: sequence 
nueleot idi que ccdant un polypeptide derive du 
recepteur nuclear re de la vit amine D humain 

<2?.Q> 

<:221> CDS 

<222> (i; . . (1123) 
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<40C > 3 

atg gsg gca atg gcg gee age act ::: ctg cct gas cct gga gac ttt 4 c 
Met Gl a Ala Met Ala Ala Ser Tnr Ser Lea Pro Asp Pro 31 y Asp Phe 

1 5 ID 15 

ga : :gg aa: g 1 5 cc: egg ate t gt ggg gt g tot gga cac eg a gtc act 96 

Asc Arg Asn Vai Fr: Arg He Cys Gly Val Cys Gly Asp Arg Ala Thr 

20 2 5 30 

gge ttt ca: ttt aat get atg acc t gt ga a age tgc aaa age ttt 1 1 r 144 

Gly Phe His Phe Asn Ala Met Thr Cys Gla Gly 2ys Lys Gly Pee Phe 

3 5 10 -15 

agg ega age atg aag egg aag gca eta ttt- aec tgc czz ttc aae ggg 192 

Arg Arg Ser Met Lys Arg Lys Ala Leu Phe Thr Cys Pra Phe Asn Gly 

50 5 5 60 

gac tgc cge ate act aag gac aat ega cgt cac tgc cag gcc tgc egg 24 C 

Asp Cys Arg He Thr Lys Asp Asn Arg Arg His Cys Gin Ala Cys Arg 

65 70 75 80 

etc aaa cgc tgt gt 3 gat ate gg : atg atg aag gag ttc att ctg aca 28 8 

Lee Lys Arg Cys Val Asp He Gly Met Met Lys Giu Phe lie Lee Thr 

65 90 95 

gat gag gaa gtg cag agg aag tgg gag atg ate ctg aag egg aag gag 336 

Asp Giu Glu Val Gin Arg Lys Arg Giu Met He Leu Lys Arg Lys Glu 

100 105 110 

gag gag gcc ttg aag gas agt ctg cgq cee aag ctg tet gag gag cag 334 

Glu Glu Ala Leu Lys Asp Ser Leu Arg ?r a Lys Leu Ser Glu Glu Gin 

115 12 0 12 5 

cag cgc ate att gee ata ctg it g gac get cae sat aag aec tac gac 4 32 

Gin Arg He He Ala lie Leu Leu Asp Ala His HH Lys Thr Tyr Asp 

130 135 14C 

cc c acc tac tec gac ttt tgc cag ttc egg cct cca gt t cgt ctg aat 4 8 C 

Pro Thr Tyr Ser Asp Phe Cys Gin Phe Are Pra Pre Val Arg Val Asn 

145 150 155 160 

gat ggt gga ggg age gtg acc tta gag ctg tec cag etc tec atg ctg 528 

Asp Gly Gly Gly Ser Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu 

165 170 175 

ccc cac ctg get gac ctg gtc agt tac age ate caa aag gtc att gge 576 

Pro His Leu Ala Asp Leu Val Ser Tyr Ser He Gin Lys Val He Gly 

180 185 190 

ttt get aag atg ata cca gga ttc aga gac etc acc tet gag gac caa 624 

Phe Ala Lys Met He Pro Gly Phe Arg Asp Leu Thr Ser Glu Asp Gin 

195 200 205 

ate gta ctg ctg aag tea agt gee att gag gtc ate ate ttg cgc tee 6" , 2 

He Val Leu Leu Lys Ser Ser Ala He Giu Val He Met Leu Arg Ser 

210 215 220 



aat gag tec ttc acc atg gac gac atg tee tgg ace tgt gge aae caa 
Asn Glu Ser Phe Thr Met Asp Asp Met Ser Trp Thr Cys Gly Asn Gin 
225 230 235 240 



~~* 2 n 
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Q3 : r.ac aac :ac cgc gt.c act gac gtc acc aaa :c: coa :a: ac: ccg 

Asp Tyr Lvs Tvr Arg Va. Ser Asp Vai Thr Lys Ala Gly His Ser Leu 

245 250 25: 

gac ctg att gaq c:c etc ate aag :tc cag gtg ?q a etc aag aag ccg 

Giu Leu Tie Giu Pro Lea lie Lys Phe Gin Vai Sly Leu Lys Lys Leu 

260 265 270 



gaa gtg ttt ggc aat gag at s tee tga 
Giu Val Fhe Gly Asn Giu He Ser 
370 375 



816 



aac ttg cat gag gag gag cat etc ctg etc atg ccs ate cgc ate gtc 861 

Asn Leu His Giu Giu Giu His Val Lee Leu Met Ala lie 2ys He Val 

275 290 235 

tec cca gat cat cct gag gtg cag gas gee gcg ctg ate gag gee ate 012 

Ser Pro Asp Arq Fro Gly Val Gin Asp Ala Ala Leu lie Giu Ala He 

2 0C 2 05 300 

cag gac cgc ctg tec aac a sa ctg cag acg tac ate cgc tgc cgc cac 960 

Gin Asd Arg Leu Ser Asn Tnr Leu Gin Thr Tyr He Arg Cys Arc His 

305 ' 310 315 320 

ccg esc ccg ggc age cac ctg stc tat gee aag atg ate cag aac eta 1008 

Pro Ho Pro Gly Ser His Leu Leu Tyr Ala Lys Met He Gin Lys Leu 

32 5 330 335 

gee gac ctg cgc age etc aat gag gag cac t.cc aag cag tae cgc tgc 105 6 

Ala Asp Leu Arg Ser Leu Asn Giu Giu His Ser Lys Gin Tyr Arg Cys 

340 3-1 5 350 

etc tec ttc cag cct gag tgc age atg aag eta acg cce etc gtg etc 1104 

Leu Ser Phe Gin Pro Giu Cys Ser Met Lys Leu Thr Pro Leu Val Leu 

355 360 36.5 



1131 



<210> 4 
<211 

<212 
<2 1 3 
<223 



376 
PRT 

Sequence artificielle 

Description de la sequence artificielle: sequence 
nucleot idique codant un polypeptide derive du 
receoteur nucleaire de la vit amine D hurr.ain 



<4C0> 4 

Met Giu Ala Met Ala Ala Ser Tnr Ser Leu Pre Asp Pro Gly Asp Phe 
15 10 15 



Asp Arg Asn Val Pro Arg Tie Cys Gly Val Cys Oly Asp Arg Ala Thr 



2 0 



3 0 



Gly Phe His Phe Asn Ala Met Tnr Cys Giu Gly Cys Lys Gly Ph 



40 



4 5 



Arg Arg Ser Met Lys Arg Lys Ala Leu Phe Thr 5ys Fro Fhe Asn Gly 



50 



55 



60 



Asc Cys Arsj He Thr Lys Asp Asn Arq Arc His Oys Gin Ala Cys Arq 

6 5 7 0 7 5 H 
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Leu Lys Arg Cys Val Asp lie Gly Met Met Lys Glu Fhe He Leu Thr 

S5 90 95 

Asp Glu Glu Val Gin Arc Lys Arc Glu Met lie Leu Lys Arg Lys Glu 
100 " 105 110 

Glu Glu Ala Leu Lys Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Glr. 
115 * 120 125 

Gin Arg He He Ala He Leu Leu Asp Ala His His Lys Thr Tyr Asp 
130 135 140 

Pro Thr Tyr Ser Asp Phe Cys Gin Phe Ara Pro Pro Val Arg Val Asn 
145 150 155 160 

Asp Gly Gly Gly Ser Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu 
165 170 175 

Pro His Leu Ala Asp Leu Val Ser Tyr Ser He Gin Lys Val lie Gly 
18C 185 190 

Phe Ala Lys Met He Pro Gly Phe Arg Asp Leu Thr Ser Glu Asp Gin 

195 200 205 

lie Val Leu Leu Lys Ser Ser Ala He Glu Val lie Met Leu Arg Ser 
210 215 220 

Asn Glu Ser Phe Thr Met Asp Asp Met Ser Trp Thr Cys Gly Asn Gin 
225 230 235 240 

Asp Tyr Lys Tyr Arg Val Ser Asp Val Thr Lys Ala Gly His Ser Leu 
245 250 255 

Glu Leu He Glu Pro Leu lie Lys Phe Gin Val Gly Leu Lys Lys Leu 
260 265 27C 

Asn Leu His Glu Glu Glu His Val Leu Leu Met Ala He Cys He Val 
275 280 235 

Ser Pro Asp Arg Pro Gly Val Gin Asp Ala Ala Leu He Glu Ala lie 
290 295 300 

Gin Asp Arg Leu Ser Asn Thr Leu Gin Thr Tyr lie Arg Cys Arg His 
305 310 315 320 

Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys Met lie Gin Lys Leu 
325 330 335 

Ala Asp Leu Arg Ser Leu Asn Glu Glu His Ser Lys Gin Tyr Arg Cys 
340 345 350 

Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu Thr Pro Leu Val Leu 
355 360 365 

Glu Val Phe Gly Asn Glu He Ser 
37C 375 



<21C:> 5 
<211> 73C 
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<:2 12> ADN 

<:? 13> Sequence art i f i ciel i e 
<2 2C- 

<L23> description de ia sequence art i f i cie 1 ie : sequence 
nucleotidique codant ur. polypeptide derive du 
recepteur rrjcleaire de ia vit amine D humam 

<?.2Q> 

<22\.' CDS 

OZ!2 > (1) . - (777) 

<:4 00> 5 

gac agt ctq egg ccc aag ctg tct gag gag cag cag cgc ate att gec 

Aid Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin Gin Arg lie He Ala 

"l 5 10 15 



oca gga ttc aga gac etc acc tct gag gac cag ate gta ctg ctg aag 
Pro Gly Phc Arg Asp Leu Thr Ser Glu Asp Gin He Val Leu Leu Lys 
85 90 95 



48 



ata ctg ctg gac gee cac cat aag acc tac gac ccc acc tac tec gac 96 
He Leu Leu Aso Ala His His Lys Thr Tyr Asp Pro Thr Tyr Ser Asp 
23 25 30 



144 



ttc tgc cag ttc egg cct cca gtt cgt gtg aat gat gqt gca ggg tct 

Phe Cys Gin Phe Ar 3 Pro Pro Val Arg Val Asn Asp Gly Gly Gly Ser 

35 4 0 4 5 

gtg acc eta gag ctg tec cag etc tec atg ctg ccc cac ctg get gac 192 

Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu Pro His Leu Ala Asp 

50 55 60 

ctg gtc agt tac age ate caa aag gtc att ggc ttt get aag atg ata 240 

Leu Val Ser Tyr Ser He Gin Lys Val He Gly Phe Ala Lys Met He 

65 70 75 SO 



■^88 



tea agt gec att gag gtc ate atg ttg cgc tec aat gag tec ttc ac: 336 

Ser Ser Ala He Glu Val He Met Leu Arg Ser Asn Glu Ser Phe Thr 
100 105 110 

atg gac gac atg tec tgg acc tgt ggc aac caa gac tac aag tac cgc 384 

Met Asp Aso Met Ser Tro Thr Cys Gly Asn Gin Asp Tyr Lys Tyr Arg 
115 120 125 

gtc agt gac gtg acc aaa gec gga cac age ctg gag ctg att gag ccc 432 

Val Ser Asp Val Thr Lys Ala Gly His Ser Leu Glu Leu He Glu Pro 

130 ' 135 140 

etc ate aag ttc cag gtg gga ctg aag aag ctg aac ttg cat gag gag 48C 

Leu lie Lys Phe Gin Val Gly Leu Lys Lys Leu Asn Leu His Glu Glu 

145 150 155 160 

gag cat gtc ctg etc atg gec ate tgc ate etc tec cca gat cgt cct 528 

Glu His Val Leu Leu Met Ala He Cys He Val Ser Pro Asp Arg Pro 

165 170 175 

ggg gtg cag gac gec geg ctg ate gag ccc ate cag gac cgc ctg tec 576 

Gly Val Gin Asp Ala Ala Leu He Glu Ala He Gin Asp Arg Leu Ser 
18C 165 190 
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aac aca ctg cag acq tac ate cgc tgc ccc cac ccg ccc ccg qgc age 62 4 

As n Thr Leu Gin Thr Tyr lie Ar i Cys Arg His Pro Fro Fro Gl y Ser 

195 ' 2 0 :• 20b 

cac ctg :tc tat gec aag atg ate cag aag ct.=i }cc qac ctg cue ace 67 2 

His Leu Lea Tyr Ala Lys Met lie Gin Lys Leu Ala Asp Lea Arc 3er 

21C 21b 220 

etc aat :ag gag cac tec aag cag tac ccc tgt :tc tec ttc cag act 7 2C 

Leu Asn Glu Glu His Ser Lys Glr. Tyr Arg Lys Lea Ser Phe Gin Pre 

225 230 235 240 

gag tge age atg aag eta a eg c — ctt: gtg etc gaa gtg ttt gge aat 7 68 

Glu Cys Ser Met Lys Leu Thr Pre Leu Val Leu Glu Val Phe Gly Asn 

245 25C 255 

gag ate tec :ga 730 
Glu lie Ser 



<21C> 6 
<211> 259 
*:212:- PR T 

« 2 1 3 : • Sequence artificieile 

<223> Description de )a sequence artificieile: sequence 
nucleotidique codant un polypeptide derive du 
recepteur nucleaire de la vit amine D humain 

<4O0> 6 

Asp Ser Leu Arg Pro Lys Leu Ser Glu Glu Gin Gin Arg lie lie Ala 
1 5 10 15 

He Leu Leu Asp Ala His His Lys Thr Tyr Asp Pre Thr Tyr Ser Asp 
20 25 30 

Phe Cys Gin Phe Arc Pro Pro Val Arg Val Asn Asp Gly Gly Gly Ser 
35 4} 4 5 

Val Thr Leu Glu Leu Ser Gin Leu Ser Met Leu Fro His Leu Ala Asp 

5 0 5 5 6C 

Leu Val Ser Tyr Ser lie Gin Lys Val lie Gly ?ne Ala Lys Met lie 
65 70 7 d 80 

Pro Gly Phe Arg Asp Leu Thr Ser Glu Asp Gin lie Val Leu Leu Lys 
85 90 95 

Ser Ser Ala lie Glu Val He Met Leu Arc Ser Asn Glu Ser Phe Thr 
100 105 110 

Met Asp Asp Met Ser Trp Thr Cys Gly Asn Gin Asp Tyr Lys Tyr Arg 
115 120 125 

Val Ser Asp Val Thr Lys Ala Gly His Ser Leu Glu Leu lie Glu Pro 
130 135 ' 140 

Leu He Lys Fhe Gin Val Gly Leu Lys Lys Leu Asn Leu His Glu Glu 
145 150 ' ' 155 160 

Glu His Val leu Leu Met Ala He Cys lie Val Ser Fro Asp Arg Pro 
165 HO H5 
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my Val Glr. Asp Ala Ala Leu lie Giu Ala He G-P. Asp Arg Le- Ser 
180 13 5 19C 

Asn Thr Leu Gin Thr Tyr He Arg Cys Arc His Pro Pro Pro Giy Ser 
195 200 205 

His I^u Leu Tyr Ala Lys Met lie Gin Lys Leu Ala Asp Leu Arc Ser 
210 " 215 220 

Leu As:i Glu Glu His Ser Lys Gin Tyr Arg Cys Leu Ser Phe Gin Pro 
225 23C 235 2-10 

Glu Cys Ser Met Lys Leu Thr Pro Leu Val Leu Glu Val Phe Giy Asn 
245 250 255 

Giu Tie Ser 



21C> 7 



<li: 

< 212 



7 62 
ADN 

Sequence artificieiie 



<2'm'.X- Description de la sequence artificieiie: sequence 
nucleot idique codant un polypeptide nderive du 
receoteur de la vi'amine D humam 



<2H CDS 

<222 > (1) . . (759) 

<-100 > 7 

ctg tct gag gag cag cag cgc ate att gec ata ctg ctg gac gec cac 48 

L-u Ser Glu Glu Gin Gin Arg He He Ala He Leu Leu Asp Ala His 

1 5 10 15 

cat aag acc tac gac ccc acc tac tec gac ttc tgc cag tto cgc cot 96 

His Lvs Thr Tvr Asp Pro Thr Tyr Ser Asp Phe Cys Gin Phe Arg Pro 

20 25 30 

cca gtt cgt gtg aat gat ggt gga ggg age gtg acc eta gag ctg tec 144 

Pro Val Arg Val Asn Asp Giy Giy Giy Ser Val Thr Leu Glu Leu Ser 

35 4C 45 

cag etc tec atg ctg ccc cac ctg get gac ctg gtc agt tac age ate 152 

Gin Leu Ser Met Leu Pro His Leu Ala Asp Leu Val Ser Tyr Ser lie. 

50 55 60 

caa aag gtc att cgc ttt get aag atg ata cca gga ttc aga gac etc 240 

Gin Lys Val He Giy Phe Ala Lys Met He Fro Giy Phe Arg Asp Leu 

6 5 7 0 7 5 3 0 

azz tet gag cac cag ate gta ctg ctg aag tea act gee att gag gtc 28 8 

Thr Ser Giu Aso Gin He Val Leu Leu Lys Ser Ser Ala He Giu Val 

6 5 90 95 
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ate atg ttg ccc tec aat gag :cc ttc acc atg gas qac «tg tec tgg 

lie Met Leu Arc Ser Asr. Glu Ser Phe Tr.r Met Asp Asp Met Ser Trp 

100 105 11C 

acc tgt ggc aac caa gac tac aag :ac cgc gtc age gac gtg arc aaa 

Tr.r Cvs Gly Asn Gin Asp Tyr Lys Tyr Arg Vai Ser Asp Val Thr Lys 

115 -20 125 

ccc gga cac age etc gag ctg att gag ccc etc ate aag ttc cag gtg 

Ala Gly His Ser Leu Glu Leu lie Glu Pro Leu lie Lys Pre Gin Val 

13C 135 1^0 

gga ctg aag aag ctg aac ttg cat gag gag gag cat gtc ctg etc atg 

Gly Leu Lys Lys Leu Asn Leu His Glu Glu Glu His Val Leu Leu Met 

14 5 1 50 155 1 6-:: 

gec ate tgc ate gtc tec cca gat cgt cct tjgg gtg cag gac gec gcg 

Ala He Gys He Vai Ser Pro Asp Arg Fro Gly Val Gin Asp Ala Ala 

165 170 175 

ctg ate gag gec ate cag gac cgc ctg tec aac aca ctg cag acg tac 

Leu Lie Glu Ala He Gin Asr Arg Leu Ser Asn Thr Leu Gin Thr Tyr 

180 165 190 

ate cgc tgc cgc cac ccg ccc ccg ggc age cac ctg etc tat gec aag 

He Arg Cys Arg His Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys 

195 200 205 



33-1 



43; 



4 30 



52f 



62-; 



atg ate cag aag eta gec gac ctg cgc age ttc aat gag gag cac tec 6".'; 

Met He Gin Lys Leu Ala Asp Leu Arg Ser Leu Asn Glu Glu His Ser 

210 ' 215 220 

aag cag tac cgc tgc etc tec ttc cag est gag tgc age atg aag eta 72; 

Lys Gin Tyr Arg Cys Leu Ser Phe Gin Pro Glu Cys Ser Met Lys Leu 

225 ' ' 230 235 240 

acg ccc ctt gtg etc gaa gtg ttt ggc aat gag ate tec tga 76J 

Thr Pro Leu Val Leu Glu Val Phe Gly Asn Glu He Ser 

245 250 



<210> 8 
<211> 253 
<212> PRT 

<213> Sequence artif icielle 

<223> Description de la sequence artif icielle : sequence 
nucleotidique codant un polypeptide nderive du 
recepteur de la vitanine D humain 

<400> 8 

Leu Ser Glu Glu Gin Gin Arg He He Ala He Leu Leu Asp Ala His 
15 13 15 

His Lys Thr Tvr Asd Pro Thr Tyr Ser Asp Phe Cys Gin Phe Arg ?r^ 
20 * 25 30 

Pro Val Arg Val Asn Asp Gly Gly Gly Ser Vai Thr Leu Glu Leu Ser 
35 40 45 

Gin Leu Ser Met Leu Pro lies Leu Ala Asp Leu Val Ser Tyr Ser He 
50 5 5 60 
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Gin Lys Val He Gly ?he Ala Lys Met lie Pro Gly Phe Arg Asp Leu 
65 70 75 60 

Thr Ser Giu Asp Gin lie Val Leu Leu Lys Ser Ser Ala He Giu Val 



He Met Leu Arg Ser Asn Giu Ser Phe Thr Met Asp Asp Met Ser Trp 

100 105 HO 

Thr Cys Gly Asn Gin Asp Tyr Lys Tyr Arg Val Ser Asp Val Thr Lys 

115 ' 120 125 

Ala Gly His Ser Leu Giu Leu He Giu Pro Leu He Lys Phe Gin Val 

130 135 140 

Gly Leu Lys Lys Leu Asn Leu His Giu Giu Giu His Val Leu Leu Met 

145 150 155 160 

Ala He Cys He Val Ser Pro Asp Arg Pro Gly Val Gin Asp Ala Ala 

165 170 175 

Leu He Giu Ala lie Gin Asp Arg Leu Ser Asn Thr Leu Gin Thr Tyr 

180 135 190 

lie Arg Cys Arg His Pro Pro Pro Gly Ser His Leu Leu Tyr Ala Lys 

195 200 2C5 

Met lie Gin Lys Leu Ala Asp Leu Arg Ser Leu Asn Giu Giu His Ser 

210 4 215 220 

Lys Gin Tyr Arg Cys Leu Ser Phe Gin Pro Giu Cys Ser Met Lys Leu 

225 230 235 240 

Thr Pro Leu Val Leu Giu Val Phe Gly Asn Giu He Ser 



8 5 



90 



95 



245 



250 
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